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Введение 


Эта книга посвящена проблеме моделирования нервных систем. Сегодня никто 
из специалистов не может представить себе со всей определенностью, как 
устроены и функционируют нервная система и мозг не только человека, 
но даже более простого организма. И тем более, пока никто не в состоя- 
нии смоделировать работу этих природных систем управления, возможности 
которых кажутся нам недостижимыми. Теперь представим себе на минуту, 
что построена действующая модель нервной системы некоторого организма, 
например мыши (эта пока нереальная задача во много раз сложнее, чем 
создание шахматного компьютера или программы, доказывающей теоремы). 
Естественно, что мозг мыши потребует наличия и точной модели тела мыши. 
Допустим, что эта модель стоит на столе, неотличимая от реальной мыши. 
Что же мы можем от нее потребовать? Какую полезную для человека работу 
она может выполнять? День и ночь рыть для нас нору? Но она не захочет 
рыть нору для нас, она захочет рыть нору для себя, а также для себя есть, 
гулять и размножаться. Что же смогут дать нам такие системы, как их по- 
строить и чем принципиально они отличаются от тех систем «искусственного 
интеллекта», над созданием которых сегодня трудятся многочисленные лабо- 
ратории? В этой книге представлены результаты разработки этих вопросов, а 
также созданные модели объектов с искусственными «нервными системами». 
Мы призываем идти вслед за природой по неизбежному для человечества пути 
создания искусственных нервных систем — систем «автономного искусствен- 
ного интеллекта». 

Человек, несколько веков назад изобретя первые машины, был сразу 
и навсегда увлечен этим феноменом и с тех пор создает все новые и новые 
их образцы, наполняя природу вокруг себя искусственными «организмами». 
Подобно живым творениям, машины развиваются, наследуя удачные решения, 
«мутируя» и «скрещиваясь», подвергаются «естественному отбору», передают 
свой «генетический код» в «геноме» технической документации, «производя 
на свет» все более совершенное «потомство». Уже давно в соревновании 
с Природой машины превзошли живые организмы во многих номинациях: 
в силе, выносливости, скорости передвижения, высоте полета и во многих 
других. Конечно, это грандиозное соревнование устраивается человечеством 
не ради эстетического удовольствия, и даже не ради удовлетворения своего 
честолюбия, хотя и то и другое, несомненно, имеет место в ряду мотиваций тех- 
нического прогресса. Главная причина эволюции машинной «фауны» состоит 
в прагматической выгоде человека. Машины в свое время успешно заменили 
рабов, и в настоящее время искусственная среда машин составляет массу 
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технорабов, обслуживающих их хозяина — человека. Всякому рабовладельцу 
энергетически выгодно иметь рабов — они производят тяжелую физическую 
работу, позволяя хозяину перейти к не столь тяжкому интеллектуальному 
труду по созданию машин и организационному труду по управлению этими 
искусственными слугами. 

Однако интеллектуальный труд тоже требует усилий и затрат энергии, 
что заставляет искать возможности построения машин, способных выполнять 
и эту работу. Задача оказалась очень трудной, но, в конце концов, были 
изобретены и в ХХ веке построены машины, способные к интеллектуальному 
труду. В процессе быстрой эволюции эти машины достигли очень высоких 
результатов и снова по многим показателям заняли первые места в соревно- 
вании с человеком. Впрочем, никто особенно и не стремится соревноваться 
с ними, как бессмысленно рабовладельцу соревноваться со своими рабами 
в силе и выносливости, а инженеру — с созданными им механизмами. Машины, 
называемые системами «искусственного интеллекта», давно обошли человека, 
в соревнованиях по точности счета (калькуляторы), по скорости и объему 
вычислений (ЭВМ), по скорости обработки символьной информации (линг- 
вистические процессоры), по скорости перевода с одного языка на другой 
(программы-переводчики), по играм (шахматные компьютеры). Интеллекту- 
альная мощность компьютеров будет, видимо, еще долго расти по всем за- 
конам эволюционного развития, так как спрос на интеллектуальных «рабов» 
повышается. Умственная работа — это нелегкий труд, и находится тысячу 
причин, почему человеку хочется переложить этот труд на чьи-нибудь плечи. 
Сфера применения ЭВМ быстро расширялась, и от ответственных расчетов, 
которыми занимались первые машины, она давно распространилась и в непро- 
изводственные области. Согласитесь, что приятно иметь симпатичного во всех 
отношениях и умного синтетического слугу, который в любое время суток го- 
тов без устали играть с вами в какие-нибудь очередные разноцветные шарики, 
в перерывах развлекая вас веселыми картинками, музыкой и прочими опциями 
повышенной комфортности. За такого слугу можно и недешево заплатить. 

Как при создании «механических», так и при создании «интеллектуаль- 
ных» машин действует примерно одинаковая итерационная схема, присущая 
процессу моделирования. Вначале воспроизводятся некоторые главные внеш- 
ние черты образа, затем они многократно уточняются в своих деталях. Так, 
при создании первых механических машин люди пытались превзойти живую 
природу в тех параметрах, которые они понимали: а именно, в силе и вынос- 
ливости — отсюда родилось желание создать еще более сильные и выносливые 
искусственные машины. В то время еще не осознавали других многочисленных 
свойств живых организмов и подчас относили их к недостаткам. И лишь 
на следующих витках цикла моделирования смысл этих свойств становился 
понятным, и они начинали учитываться при проектировании. Такие понятия, 
как экономичность, эффективность, оптимальность, экологичность, и дру- 
гие постепенно осваивались наукой и вводились в практику. Сегодня любая 
машина отвечает гораздо большему спектру требований, чем аналогичная 
по назначению машина прошлого. Природа машин поневоле вошла в тесное 
взаимодействие с естественной природой и вынуждена, была «притереться» 
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к ней. В частности, в технологии создания механических машин теперь исполь- 
зуются разнообразные знания о естественной природе, пришедшие из химии, 
энергетики, аэродинамики, физики и т. д. В каком-то смысле современная 
механическая машина, будучи искусственным чуждым природе объектом, уже 
частично «вписана» в окружающую естественную среду по многим пара- 
метрам. 

Подобный ход развития повторяют и интеллектуальные машины, но с неко- 
торой задержкой на старте. Уже успешно пройден этап создания интеллекту- 
альных машин, перекрывших указанные выше интеллектуальные возможно- 
сти человека. Однако современные компьютеры пока еще слабо вписываются 
в Природу. Ни по принципам своего действия, ни по своим функциональным 
свойствам они не похожи на природные «компьютеры» — нервные системы. 
Именно эти белые пятна современных компьютеров и составляют сегодня 
важные направления развития компьютерных и смежных с ними наук. 

Кем и какими способами решается задача сближения свойств искусствен- 
ных и естественных интеллектуальных машин — компьютеров и нервных 
систем живых организмов? Основные участки фронта исследования держат 
нейрофизиологи, кибернетики и математики (мы не знаем, чем заменить 
вышедшее нынче из моды слово «кибернетика», поэтому будем продолжать 
пользоваться им, понимая под этим науку, занимающуюся проблемами 
построения систем управления, систем распознавания, систем, работающих 
со знаниями и другими соответствующими вопросами). Однако беда в том, 
что между этими мощными силами почти не налажено взаимодействие. 
Препятствием является необходимость освоения большой суммы специальных 
знаний, требующихся для работы в каждой из этих областей. Трудно найти 
человека, который обладал бы профессиональными знаниями одновременно 
в биологии, кибернетике и математике. 

На наш взгляд, проблема исследования принципов действия нервных си- 
стем обусловлена следующими особенностями предмета исследования. Всякий 
живой организм для поддержания своего существования и своего развития 
должен управляться. В результате специализации в живых организмах вы- 
делились и сформировались специальные средства для управления, в част- 
ности — нервные системы (мозг везде ниже будем полагать частью нервной 
системы). Управление живым организмом в априори мало известной для него 
и изменяющейся среде по необходимости должно быть самообучаемым — 
адаптивным. Система адаптивного управления обязана решать определен- 
ные задачи управления, причем в определенной их последовательности. Это 
такие задачи, как автоматическая классификация, распознавание образов, 
представление знаний, выработка качественных критериев, прогнозирование, 
принятие решений, поиск и накопление знаний, вывод новых знаний, и неко- 
торые другие. Именно решение этих задач обеспечивает приспособительное 
поведение организма и, следовательно, его выживание. Смысл этих задач 
понятен в основном только кибернетику. Каждая из этих задач в отдельности, 
при условии, что она строго формализована, хорошо понятна математику, при 
этом от математика вовсе не требуется понимания необходимости решения всех 
этих задач в совокупности в одной системе. Уже здесь видна проблема взаи- 
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мопонимания биолога, кибернетика и математика. Однако дальше ситуация 
с предметом исследования еще больше усложняется. Природа, решая задачу 
адаптивного управления в развитии любого своего образования — клетки, 
организма, нервной системы, биологического вида и т. д., на следующем этапе 
включает не менее мощные механизмы оптимизации — найденные полезные 
способы действия, тактики, навыки, приспособления и т. д. Эти механизмы 
«утрамбовываются» в очень компактные и эффективные структуры, для каж- 
дой из них находится такой искусный способ реализации и в такой форме, что 
далеко не сразу в нем можно узнать первоначальную его форму и функцию. 
Здесь уместен следующий пример, особенно понятный тем, кто занимался 
радиотехникой. Принципиальная радиосхема вначале придумывается и ри- 
суется на бумаге. Затем из радиодеталей на просторном картоне спаивается 
вся конструкция из реальных радиодеталей, которые еще расположены почти 
так, как изображено на принципиальной схеме. Когда радиосхема отлажена 
и работает, разрабатывается и создается компактная печатная плата, на ко- 
торой имеются все нужные радиодетали и соединены они в ту же самую 
логическую схему, но размещены они так компактно и рационально, а соеди- 
няющие их проводники так коротки и так оптимально разведены, что понять 
принципиальную схему, глядя на готовую плату, практически невозможно. То 
же самое делает Природа, но при этом она изощрена гораздо больше, чем 
радиолюбитель, и меняет не только расположение деталей, но и их способ 
реализации — один проводник может быть реализован нервным волокном, 
другой — в виде нейромедиатора, одна деталь реализована синапсом, дру- 
гая — в хромосоме и т. п. Специалисты, которым доводилось пытаться понять 
работу электронных устройств с неизвестной заранее схемой, согласятся, что 
сделать это крайне трудно, даже зная общий принцип работы такой схемы. 
А если этот принцип неизвестен, как неизвестен и способ реализации элементов 
схемы? 

И вот нейрофизиологу поступает на изучение такой объект, принцип ра- 
боты которого не знает никто. С помощью современной экспериментальной 
техники он начинает рассматривать одну микроскопическую деталь за дру- 
гой и... вынужден признать, что не может понять логику работы объекта в це- 
лом. Ведь в нервной системе человека миллиарды нейронов, сотни миллиардов 
нервных волокон, масса химических процессов, проследить за совместной 
работой которых просто невозможно. Следует сказать, что непонятен принцип 
работы нервных систем и более простых организмов, содержащих вполне обо- 
зримое количество нейронов. Более того, сегодня до конца не ясна работа даже 
одного отдельного нейрона. Если принять за гипотезу, что нервная система 
работает как кибернетическая схема, обеспечивающая адаптивное управление, 
то нейрофизиолог не обязан понимать эту схему — она совсем не из его науки. 
Биолог не обязан знать математические основы решения задач распознавания 
образов, самообучения и других. Как же он может понять принципиальную 
схему работы данной системы? Нейрофизиологи вынуждены заниматься изу- 
чением либо деталей (например, калий-натриевых насосов в мембране нерв- 
ного волокна), либо макропроявлений нервной системы (общими закономерно- 
стями поведения организмов). Во многих других областях биология добилась 
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ярких успехов именно такими методами изучения. Но достаточно ли этих 
подходов для изучения нервной системы — сложной и очень оптимизированной 
системы управления, принцип действия которой определяется ее логической 
структурой? 

К математику идти с вопросами об устройстве нервной системы уж точно 
бесполезно. Он, полжизни посвятивший изучению благородной стихии матема- 
тики, панически боится начинать погружение в новую не менее благородную, 
но бездонную стихию биологии, и просит формализованных постановок задам. 
Биолог не может дать математику таких постановок. Разве что математик 
получит математически формализованную модель «искусственной нейронной 
сети», пусть почти не имеющей отношения к нервной системе, но ставящей 
перед математиком обозримые задачи — например, как сделать так, чтобы 
при обучении нейросеть не застревала в локальных минимумах. 

Специалист от кибернетики тоже очень неохотно берется за задачу мо- 
делирования работы нервной системы. Во-первых, его пугает малоизвестная 
ему наука биология с массой ее специфических фактов, со своим языком 
и своими подходами к решению задач. Как правило, кибернетики заняты 
решением конкретных прикладных задач, которые им ставятся заказчиками 
из промышленности. Выработаны замечательные схемы, позволяющие стро- 
ить высокоэффективные системы управления для разнообразных прикладных 
объектов. Рассмотрим, например, общепринятую схему на рис. 2.11, с. 58, где 
объект управления, блок датчиков, система распознавания, система управле- 
ния и исполнительные органы работают в одном последовательном цикле. При 
этом влияние среды проявляется лишь в возмущающем воздействии, оказывал 
емом ею на объект управления, а система управления, пользуясь заданным ей 
заранее рассчитанным законом управления, осуществляет лишь минимизацию 
рассогласования текущего состояния объекта управления и заданного целевой 
функцией состояния. Эта схема является замечательной и практически очень 
полезной, но крайне упрощенной по сравнению с теми условиями, в которых 
работает нервная система. В реальных условиях, например, система распо- 
знавания является самообучаемой, поэтому априори задать закон управления 
нельзя, он должен вырабатываться автоматически. Целевые значения пара- 
метров заданы далеко не полностью, целевой функцией управления является 
не поддержание гомеостазиса (минимизация рассогласования текущих и за- 
данных параметров), а поиск знаний и способов выживания. При этом помеха, 
со стороны среды действует не только на объект управления, но и на все 
элементы системы, да и само понятие среды не определено, а свойства всех 
составляющих системы изменяются со временем. Эти условия выходят далеко 
за рамки типичной схемы управления. По этой причине специалисты от систем 
управления не хотят заниматься проблемами моделирования нервных систем. 
«Зачем говорить о нейронах, нервных системах и биологии, когда мы в этом 
ничего не понимаем? Никто не знает, как работает нервная система, и незачем 
браться за это. В лучшем случае будем говорить о биологии вскользь и метафо- 
рически. Давайте делать математически формализованные постановки задач 
и решать их. А прикладные системы вообще можно делать эвристически», — 
вот типичные слова специалистов по системам управления. 
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На этом круг замыкается. Хотя существует еще компромиссный вариант, 
на который охотно соглашаются кибернетики, — это так называемый прагма- 
тический подход. Здесь допускается строить системы управления, по внешним 
проявлениям имитирующие поведение живой системы, но без всякой оглядки 
на принцип действия последней. Это плодотворный подход, и он приносит 
много полезных практических результатов. Большинство современных си- 
стем «искусственного интеллекта» вышло из этого направления: экспертные 
системы, шахматные компьютеры, красивые японские гуманоидные роботы 
и другие системы такого рода научены делать нечто внешне похожее на то, что 
умеет делать человек. Но принцип действия таких систем нимало не похож 
на работу нервной системы. А отсюда следует и принципиальная ограни- 
ченность таких систем. Так, шахматный компьютер может только играть 
в шахматы, и ничего другого. Экспертная система может только воспроиз- 
водить ту информацию, которая записана в ее базе данных. Робот обычно 
только воспроизводит программу детерминированного закона управления, 
которая может быть достаточно сложной, но редко содержит хотя бы ка- 
кие-то элементы автоматического самообучения. Этот подход, направленный 
на внешнюю имитацию, подобен созданию искусных игрушек, он, безусловно, 
приведет к появлению полезных роботов и других интеллектуальных систем, 
но не приблизит нас к пониманию принципа действия нервных систем. 

Однако существует и еще один путь к исследованию и моделированию 
принципа действия нервных систем, которому посвящена данная книга и 
который, по нашему убеждению, может организовать плодотворное сотруд- 
ничество нейрофизиологов, кибернетиков и математиков. Кратко обозначим 
этот путь с помощью следующих призывов. 


1. Кибернетики! Давайте посмотрим на живой организм в самом общем его 
виде — как на часть окружающей среды, обособившуюся от нее и старающуюся 
выжить, сохранить себя в ней не за счет своей физической крепости, но за счет 
соответствующего целесообразного управления своим поведением. Давайте 
посмотрим на нервную систему как на автономную (бортовую) систему управ- 
ления, которая, обладая минимумом исходной информации, должна — иначе 
она погибнет вместе с этим телом — найти способы управления доставшимся ей 
при рождении неизвестным телом, помещенным в неизвестную окружающую 
среду. Ведь для решения такой задачи должен существовать некий алгоритм, 
и таких алгоритмов не может быть много. О существовании такого алгоритма 
и его единственности свидетельствует вполне определенная схожесть строения 
и функционирования нервных систем всех живых организмов. Так давайте 
же, вооруженные знаниями теории управления и сопутствующих ей задач, 
знаниями тех условий, в которых существует живой организм как самообуча- 
емый объект управления, нарисуем, наконец, этот алгоритм и попробуем его 
воплотить в программных и физических моделях. 


2. Математики! Предлагаем вам формализовать и решить подзадачи, вы- 
текающие из разработанной схемы автономного адаптивного управления. Это 
не простые задачи. Вы умеете строить, например, систему управления, когда 
число управляющих стратегий заранее известно. А надо построить систему 
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управления, когда число и содержание стратегий управления заранее неиз- 
вестно, алфавит классов в самообучаемой системе распознавания заранее 
неизвестен, платежная матрица заранее неизвестна и имеется еще ряд условий. 


3. Биологи! Просим вас оценить биологичность поведения получившихся 
алгоритмов автономного адаптивного управления и моделей управляемых 
им объектов. Попробуйте понять необходимость существования в организме 
средств решения перечисленных задач, вынужденно необходимых организму 
для управления, найти и подсказать кибернетикам, в каком виде природа 
реализует механизмы решения этих задач. 


И вот когда эти задачи будут решены, мы с вами получим машины 
совершенно нового типа. Это будут машины, обладающие такими свойствами 
живых организмов, как способность самообучаться непосредственно в течение 
жизни, приспосабливаться к обстоятельствам окружающей среды, накап- 
ливать знания, выживать за счет все более разумного принятия решений. 
Речь идет не о компьютерах, которые лучше человека играют в шахматы, 
а о машинах, способных, подобно домашним животным, приспосабливаться 
к людям, окружающей обстановке, особенностям своих рабочих обязанно- 
стей и т. п. Нужны ли нам такие машины? Мы думаем, что нужны. Посмотрите 
на Природу. В ней все способно приспосабливаться друг к другу. Растения, 
животные, люди — все только и делают, что приспосабливаются, адаптируются 
друг к другу. Мы приспосабливаемся к людям, работающим рядом с нами, 
а они приспосабливаются к нам, к нашим особенностям, привычкам, типичным 
задачам, ошибкам, и т. д. Ваша, собака приспосабливается к вам, а вы — к ней. 
Примеры можно продолжать до бесконечности. 

В способности приспосабливаться состоит едва ли не основное отличие 
живого от неживого. Вместе с тем в создаваемой нами искусственной 
природе — технике налицо блестящее отсутствие способности к автомати- 
ческому приспособлению! Не то чтобы нам это было не нужно, а просто 
мы научились искусно обходить свое неумение делать адаптивные вещи. 
Мы обходим этот вопрос на этапе конструирования вещей, а именно — 
приспосабливая их заранее к среднестатистическому пользователю, к сред- 
нестатистическим условиям, в которых данной вещи предстоит работать по 
нашим прогнозам. Мы делаем кресло автомобиля таким, чтобы в нем было 
удобно сидеть среднестатистическому пассажиру. В качестве дорогой опции — 
заменителя автоматической адаптации мы приделываем к креслу ручку, 
с помощью которой можно отрегулировать наклон спинки. Неубедительная 
способность к адаптации, надо сказать. Подвеска автомобиля рассчитана, 
на среднестатистические дороги и средний вес средних пассажиров. Вас 
заранее сочли средним и лишили автомобиль возможности попривыкнуть 
к вашему истинному весу. Трубку вашего телефона рассчитали на средний 
размер средней руки, а уровень громкости подогнали под среднее ухо среднего 
клиента. Мы не замечаем этого, но мы окружили себя косными вещами, с 
точки зрения природы — совершенно тупыми. Вы можете десять лет делать 
одну и ту же ошибку на клавиатуре, но компьютер не поймет этого и не 
научится сам ее исправлять. Вы можете годами включать телевизор в одно 
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и то же время и на одну и ту же программу, но он никогда не научится 
включаться в это время сам, чтобы сделать вам приятное. Лопоухий щенок 
быстро приспособится к вашим привычкам, доставляя вам большую радость, 
а эти глупые домашние приборы не способны ни на что в этом смысле. А ведь 
существуют и весьма важные системы и машины, где автоматическая адапта- 
ция кажется совершенно необходимой, поскольку ее просто нечем заменить. 

Современные способы построения систем управления, основанные на пред- 
варительном построении математической модели объекта управления и вы- 
числении необходимого закона управления, очень часто пасуют перед все 
расширяющимся кругом объектов, которыми хотелось бы управлять автома- 
тически. Специалисты знают, что построить точную математическую модель 
управления удается далеко не для всех объектов. Если сказать честно, то 
хорошо управляются только такие объекты, как математический маятник, 
шарик на абсолютно жесткой пружине и полет абсолютно твердого тела 
в абсолютно безвоздушном пространстве. Как только появляются отклонения 
от этих абсолютных математических моделей — сопротивление среды, силы 
трения, нелинейности, сложные конструкции, помехи и т. п., математическая 
модель объекта резко усложняется и быстро достигает катастрофической 
сложности, которую приходится преодолевать разнообразными упрощениями, 
огрублениями, искусственными приемами. Но иногда и это не спасает ситу- 
ацию, и построение системы управления становится невозможным. Не поду- 
майте, что речь идет обязательно о таких сложных объектах, как, например, 
вертолет. Не удается построить математическое описание и для гораздо более 
простых объектов. А вот человек может управлять такими объектами! Потому 
что человек — адаптивная система управления. И создание таких систем 
управления, которые, подобно человеку, были бы способны адаптироваться 
к самым разным ситуациям, — дело чрезвычайно важное и полезное. 

Системы, о которых идет речь, нельзя отнести к направлению, которое 
называется нынче системами «искусственного интеллекта» (ИИ). Ни одна 
из современных систем ИИ не похожа по своим свойствам на искусственную 
нервную систему. Поэтому мы назвали разрабатываемые нами системы си- 
стемами «автономного искусственного интеллекта» (АИИ). Это совершенно 
новый вид машин, со своей технологией, своими проблемами и своей сферой 
использования. 

Рассмотрению возможностей построения такого рода систем АИИ и посвя- 
щена данная книга. Мы рассматриваем этот вопрос исключительно подробно, 
рассчитывая на то, чтобы было одинаково понятно и интересно и кибернетику, 
и математику, и биологу, и специалистам по прикладным системам, которые 
могли бы построить такого рода систему АИИ для своих объектов. 

Желающие ознакомиться с более формализованным описанием предла- 
гаемых систем автономного адаптивного управления (ААУ), которые лежат 
в основе систем АИИ, могут найти его в наших публикациях [56-119]. 
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О правах, обязанностях и терминологии 


Призывая к междисциплинарному общению, автор понимает, что сталкивается 
с массой соответствующих специфических проблем. Первая проблема форму- 
лируется вопросом: имеет ли право специалист из одной области покушаться 
на исследования в другой области? Например, конкретно в данном случае: 
может ли кибернетик сказать что-то новое биологу, полжизни посвятившему 
своему предмету? Ответ, безусловно, положительный, потому что разные спе- 
циалисты смотрят на один и тот же объект с разных точек зрения, а это дает 
возможность каждому из них видеть подчас такие стороны, которые скрыты 
от другого. Примеров тому в истории науки и техники множество. Поэтому мы 
не только считаем правомерным вторжения из одной науки в другую, но при- 
зываем вменить это в обязанности кодекса ученого, буде такой когда-нибудь 
оформится. Второй важный камень преткновения связан с терминологией. В 
каждой науке принята своя терминология, под которой понимаются строго 
определенные вещи. При междисциплинарных исследованиях возникает необ- 
ходимость использования терминологии из одной области специалистами из 
другой, при этом, в силу новой точки зрения на предмет, термины в их 
устах начинают означать не совсем то, что они означали традиционно. Но это 
естественно и неизбежно. Тезаурус любого языка в текущий момент конечен, 
и он постоянно развивается, прежде всего за счет постепенного изменения 
значений старых терминов и, что более трудно, появления новых терминов. 
Мы видим, что очень часто старые термины используются для обозначения 
новых понятий, в том числе в новых областях. Примеры: биологи используют 
термины из кузнечного дела — «молот» и «наковаленка» для обозначения де- 
талей органов слуха, а авиаторы используют биологический термин «крылья» 
для обозначения плоскостей самолета и т. д. А если специалисты одной науки 
моделируют объекты другой науки, то они просто вынуждены пользоваться 
названиями моделируемых объектов. Мы полагаем, что «терминологическая 
проблема» вполне может решаться соответствующими договоренностями при 
обоюдном стремлении к междисциплинарным исследованиям. 


О структуре книги 


Глава 1 «Нервная система — машина адаптивного управления» содержит 
описание основной идеи исследования, определяющей смысл алгоритма 
функционирования нервных систем. В главе 2 «Анализ естественной системы 
управления» мы проанализируем естественные нервные системы, пытаясь 
смотреть на них как на управляющие системы и стараясь понять принцип 
их действия именно с системной точки зрения. В главе 3 «Синтез моделей 
нервных систем» будут представлены разработанные нами математические 
и компьютерные модели нервных систем. В главе 4 «Языковые явления» 
будет представлен небольшой, но очень важный материал, касающийся 
механизмов образования и использования языкового общения, связанного 
с рассматриваемыми системами. В главе 5 «Системы автономного искус- 
ственного интеллекта» будет показано, что системы управления, которые 
рассматриваются в данной книге, не относятся к классу систем «искус- 
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ственного интеллекта» в их современном понимании, а образуют новый 
класс систем со своими характерными признаками и возможной сферой 
применения. Этот класс предлагается называть «системами автономного 
искусственного интеллекта» (АИИ). Это центральная часть книги. В главе 6 
«Практические приложения» представлено несколько прототипов прикладных 
систем, разработанных на основе описанных принципов. В главе 7 «Сравнение 
метода ААУ с альтернативными методами» разработанные системы автоном- 
ного адаптивного управления сравниваются с существующими современными 
подходами, стоящими наиболее близко в каких-либо отношениях. 


Список сокращений 


— ААУ — автономное адаптивное управление 

— АИ — автономный интеллект 
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1.1. Интеллект человека в центре внимания 
всех сфер культуры 


Человек и главный феномен его сущности — сознание, мышление, а также 
отношения человека с окружающим миром находятся в центре внимания 
всей духовной и материальной культуры. Человеку всегда был и, вероятно, 
всегда, будет интересен прежде всего он сам, и это не столько эгоизм, сколько 
жизненная необходимость. 

Но чем больше мы узнаем о человеке, о таких его сторонах, как мозг, 
мышление, интеллект, тем больше появляется новых неожиданных проблем, 
тем дальше отодвигается их разрешение. «Чем шире круг твоих знаний, тем 
больше его граница с неизвестностью. И чем больше ты станешь узнавать но- 
вого, тем больше будет возникать у тебя неясных вопросов», — сказал Анакси- 
мен в УІв. дон. э. Ниже мы приведем график (см. рис. 3.63), на котором будет 
видно, что энтропия наших знаний (энтропия — это мера неопределенности 
знаний) действительно возрастает (!) по мере того, как наша нервная система 
накапливает знания. Ушедший ХХ век принес нам знаний несравненно больше 
любого из предшествующих веков, но увеличилась и граница нашего незнания. 
Груз загадок, вопросов и проблем навис над нами, и накопленный опыт уже 
не позволяет считать, что эти проблемы легко преодолимы. 

Настоящая книга имеет целью изложение лишь авторской концептуальной 
модели нервных систем. При этом мы отказались от желания ознакомить 
читателя со всеми известными концепциями нервных систем. Следующая диа- 
грамма (рис. 1.1) объясняет это решение. Здесь изображены только некоторые 
основные сферы человеческой духовной культуры, с позиций которых люди 
пытаются понять важнейшие для нас феномены сознания, мышления, мозга, 
нервной системы, живого, природы. 

Очевидно, что краткий обзор всех обозначенных на рисунке подходов к 
изучению интересующего нас предмета во всех сферах человеческой культуры 
и перечисление даже основных достигнутых на этом пути результатов потре- 
бовали бы специальной книги. 
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Рис. 1.1. Практически все сферы человеческой культуры уделяют пристальное 
внимание феноменам сознания, мышления, мозга, нервных систем 


Прежде всего хотелось бы объяснить само существование такого боль- 
шого числа подходов к изучению феномена мышления. Объяснение, на наш 
взгляд, состоит в следующем. Можно говорить, что мозг людей, как и других 
животных, работает с образами, отражающими объекты, процессы и другие 
явления в мире, которые кажутся ей не случайными. Процессы формирования 
и распознавания образов связаны со специфическими процессами в рецепто- 
рах, нервных сетях, и отражаются в нервных импульсах, размерах синапсов, 
концентрации химических медиаторов, некоторых других физиологических 
явлениях. В этом отношении все образы равны, независимо от того, относим ли 
мы это явление к науке, искусству или религии. Далее мозг старается сложить 
образы во взаимосогласованные системы, в которых устанавливаются различ- 
ные связи между образами — родо-видовые, причинно-следственные и другие. 
Если система таких образов и их ассоциативных связей становится достаточно 
обширной, развитой и взаимосогласованной настолько, что нервная система 
может пользоваться этими знаниями для принятия решений, если эти решения 
приносят планируемые результаты, то такая система знаний — мировоззрение 
объективна в определенной степени. Мы не можем и не должны утверждать, 
что та система знаний, которую мы называем «современной наукой», абсо- 
лютно объективна и единственная имеет право на доверие. Во-первых, эта 
система знаний далеко не полна, и многие ее разделы все еще остаются не свя- 
занными друг с другом. Во-вторых, эта система знаний — современное науч- 
ное мировоззрение, сложилась по историческим меркам только в последнее 
мгновение истории человечества, тем более — животного мира. До этого люди 
и животные (!) пользовались другими системами знаний, а подавляющая часть 
людей, не владеющая научным методом, успешно пользуется ими и по сей 
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день. Можно даже констатировать, что прежние «не научные» системы знаний 
успешно позволили виду Ното ѕаріепѕ выжить в его 40-тысячелетней истории. 
Сможет ли новоявленное «современное научное мировоззрение» обеспечить 
выживание человечеству — это еще вопрос. В нем, в отличие от прежних 
систем знаний, имеются такие образы, как дифференциал и интеграл, цепная 
реакция и озоновая дыра, но явно отсутствуют образы, соответствующие 
таким понятиям, как добро и зло, понимание одухотворенности природы, 
ощущение себя ее частью, уважение ко всему живому. И не «ненаучными» ли 
знаниями обеспечивается пока спасение человечества от гибельных ловушек, 
с энтузиазмом разрабатываемых современной наукой? — мы пока не знаем, 
но это весьма вероятно. 


1.2. Задачи адаптивного управления 


Мы предлагаем взглянуть на нервную систему как на специализированную 
систему управления, обеспечивающую адаптивное управление организмом, ко- 
торый при рождении попадает в неизвестную ей окружающую среду, свойства 
которой ей не понятны. От того, сможет ли нервная система найти в этих 
условиях какие-либо адекватные и надежные способы управления, зависит, 
выживет ли данный организм или погибнет. 

В общем виде задача адаптивного управления состоит в поиске знаний 
о свойствах системы «организм — окружающая среда», выделении полезных 
знаний и использовании их для целесообразного управления. Здесь первой 
важной составляющей выступает задача, поиска новых знаний. На какие же ал- 
горитмы поиска знаний может опираться нервная система, всякого организма? 
Поиском ответа на вопрос о способах добывания новых знаний, о способах 
познания окружающей действительности, наука занималась издревле. Фак- 
тически, этот вопрос был центральным вопросом науки во всей ее истории. 
И наука нашла ответ на этот вопрос. Этот ответ содержится в положениях 
гносеологии — разделе философии, представляющем собой науку о познании. 
Гносеология дает нам не что иное, как найденный в результате многовековых 
исследований универсальный алгоритм поиска новых знаний. 

Этот алгоритм поиска новых знаний является исключительно полезной 
практической вещью. Он дает нам методику изучения окружающей действи- 
тельности. Эта методика лежит в основе всех научных методов исследования 
Природы. 

Однако мы почему-то не обращаем внимания на то, что кроме нас, людей, 
исследованием окружающей действительности постоянно занимаются... все 
живые организмы. Любой живой организм находится в непрерывном поиске 
лучших условий существования. Такой поиск является необходимым условием 
его жизни как объекта, чье существование определяется эффективностью 
работы его «бортовой» управляющей системы. Если читатель полагает, что 
жизнь организмов в основном управляется чем-то извне, то он может отло- 
жить эту книгу. Возможно, что этот читатель прав. Но в данной книге мы 
опираемся на гипотезу о том, что организмы управляются их собственными 
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«встроенными», автономными системами управления. Если мы принимаем 
эту гипотезу, то соглашаемся с тем, что управляющие системы организмов 
реализуют некоторый алгоритм поиска новых знаний. И вот мы подходим 
к вопросу: каким алгоритмом поиска новых знаний пользуются живые орга- 
низмы? Какой алгоритм поиска предлагает им Природа? А не тот ли это самый 
алгоритм, который умные люди сформулировали в результате многовековых 
исследований этого вопроса? Весьма вероятно, что и люди, и Природа нашли 
один и тот же алгоритм, поскольку он, по-видимому, не имеет альтернативы. 


Мы предлагаем следующую гипотезу — нервные системы всех жи- 
вых организмов, включая человека, а также самые простые организмы, 
даже не имеющие нервной системы, для поиска новых знаний, для 
освоения окружающей действительности, для приспособления к ней, 
в процессе своего адаптивного управления пользуются одним и тем же 
алгоритмом, описываемым в гносеологии. 


Этот алгоритм поиска знаний, приспособления, адаптации, неизбежен, так 
как он логически вынужден. (Когда книга была уже написана, чл.-корр. РАМН 
К. В. Анохин обратил внимание автора на то, что аналогичная гипотеза уже 
была выдвинута в 1950 г. английским философом и социологом Карлом По- 
ппером [55]. Мы полагаем, что наше невольное «переоткрытие» подтверждает 
правильность обсуждаемого утверждения.) 

Способы реализации этого алгоритма многолики и разнообразны, как 
разнообразны и разномасштабны объекты и знания, с которыми приходится 
оперировать живым организмам разной сложности. Одноклеточная бактерия 
е-сой, пытающаяся приспособиться к новому источнику пищи, и огромный 
научный коллектив, ведущий сложное исследование, действуют в этом смысле 
по одному и тому же алгоритму познания (да не обидятся на нас большие 
научные коллективы и одноклеточные бактерии е-соі). Читателей, которые 
не допускают возможности системного представления как большого научного 
коллектива, так и бактерии с помощью одинаковой схемы — блока «перера- 
ботка информации» с одним входом «входная информация» и одним выходом 
«выходная информация», просим не волноваться. 

Итак, мы предполагаем, что нервная система любого организма, призван- 
ная от природы осуществлять адаптивное управление, реализует единственно 
возможный и данный ей этой же Природой алгоритм познания. Однако, 
помимо задачи познания, адаптивное управление предполагает также решение 
задачи сохранения найденных знаний — выживания организма, который явля- 
ется носителем нервной системы, которая, в свою очередь, является носителем 
знаний. И, наконец, необходимым является этап оптимизации, без которого 
нельзя ни эффективно представлять и сохранять знания, ни эффективно 
управлять, ни эффективно выживать в агрессивной окружающей среде. 

Любой живой организм в процессе эволюции живой природы мы можем 
метафорически представить в виде всеядного активного познающего устрой- 
ства, которое жадно ищет и «поедает» знания об окружающей его в целом 
враждебной и агрессивной среде, переводя неизвестное в известное, неопре- 
деленное — в определенное, используя накопленные знания для борьбы за 
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выживание. Но поскольку объем памяти, куда это устройство вечного по- 
знания может складывать накопленные знания, ограничен, оно ищет способы 
компактного представления знаний, в частности, преобразуя самые надежные 
знания в «твердые» компоненты своего тела. Так, однажды удачно найденные 
нервной системой способы передвижения, превращаются в соответствующей 
формы приводы (например, удачно найденный древними медведями способ 
использования лап для гребли в воде со временем материализовался у их 
потомков-моржей (по одной из версий) в ластах, в которые преобразились 
лапы), часто используемая входная информация определенного вида приводит 
к формированию новых органов чувств, оказавшиеся эффективными инфор- 
мационные связи образов приводят к определенным конструкциям нервной 
сети и т. д. При каждом таком превращении информации в материю высво- 
бождаются ограниченные ресурсы нервной системы организма, которые вновь 
направляются на поиски новых знаний. Исследовательский аппарат всякого 
организма не так уж и велик, но он постоянно в работе, а найденные им 
знания постепенно превращаются в тело и стереотипы поведения организма. 
Сказанное в определенном смысле мы относим и к филогенезу, и к онтогенезу. 

В настоящей книге мы в основном остановимся на рассмотрении вопроса 
о том, как на системном уровне должна быть устроена нервная система живого 
организма, чтобы она могла реализовать алгоритм поиска новых знаний, их 
представления и последующего принятия решений. Важных вопросов опти- 
мизации представления и использования найденных эмпирических знаний мы 
коснемся только вскользь, так как это отдельная большая тема. 

Итак, рассмотрим данный алгоритм активного поиска новых знаний. 


1.3. Алгоритм добывания новых знаний 


Алгоритм добывания новых знаний, предлагаемый нам гносеологией, может 
быть в обобщенном виде представлен последовательностью следующих шагов. 


Шаг І. Любым способом найди хотя бы одно достоверное звено 
искомого знания и сохрани информацию о нем в своей 
памяти — Базе Знаний. Если имеется априорная информация, 
то это и есть искомое первое звено. Если ее нет, то ищи первое звено 
полезных знаний, например, методом случайного поиска. 


Шаг П. Проанализируй априорную информацию из своей Базы 
Знаний об уже известных звеньях знаний и сделай обос- 
нованное предположение о том, в каком направлении, сле- 
дует искать следующие звенья (т. е. выведи новые ги- 
потетимческие знания). Это предполагаемое направление будет 
не точным, а только вероятностным, т. е. оно будет представлять 
собой некоторый диапазон возможных направлений поиска. 


Шаг ПІ. Ищи новые знания в предполагаемых шагом П направле- 
ниях, начиная с наиболее вероятных. Если успех не до- 
стигнут, то снова вернись к шагу І. Если успех достигнут 
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и новое звено полезных знаний найдено — переходи к следующему 
шагу. 


Шаг ТУ. Сохрани информацию о новом звене знаний в своей Базе 
Знаний и переходи к шагу І. 


Напомним, что при разработке систем управления под «априорной» ин- 
формацией (от лат. «а ргіогі» — то, что было перед этим) понимается та 
информация, которая имелась до момента начала функционирования системы, 
в отличие от «апостериорной» информации (от «а роѕіегіогі» — то, что было 
после этого), которая поступает или вырабатывается уже после начала (в про- 
цессе) работы системы. 

Алгоритм поясним на следующем содержательном примере. Пусть геологу 
требуется найти и нанести на карту русло подземной реки, а инструментом по- 
иска является установка для бурения скважин. Здесь вопрос о полезности для 
выживания человека искомых знаний о русле реки скрыт за словом «требу- 
ется». Этим подразумевается, что не любые знания мы будем искать в данном 
случае, а только знания о русле реки, необходимые данному человеку-геологу. 


Шаг І. Если имеется хотя бы одна скважина или другие данные, указыва- 
ющие на положение хотя бы одной точки русла, то будем считать 
шаг І выполненным. Эти априорные данные могли быть получены 
геологом из теоретических данных по геологии, из других источни- 
ков, либо могли быть случайно найдены при проведении каких-то 
других работ ит. п. Возможно, что априорные данные есть, но 
имеют вероятностный характер, и указывают только на некоторую 
предполагаемую территорию, где пролегает искомое русло реки. 


Шаг П. Нанеся на карту и проанализировав все имеющиеся отдельные све- 
дения о русле подземной реки, геолог строит обоснованную гипотезу 
о возможном направлении, в котором русло продолжается. Опреде- 
ляются более вероятные и менее вероятные направления. Эти пред- 
полагаемые направления обоснованы теми данными о русле реки, 
которые уже получены, и имеющимися теоретическими знаниями 
о свойствах подземных рек. 


Шаг ПІ. Теперь надо проверить сделанные гипотезы и обнаружить истинное 
положение русла. Для этого следует произвести пробные бурения 
в местах, указанных гипотезой. При этом с одной стороны, начинать 
бурение следует с тех мест, которые являются наиболее вероятными 
согласно гипотезе, а вероятность попадания на русло тем выше, 
чем ближе к предыдущим скважинам будет производиться бурение 
новой. Однако, с другой стороны, хотелось бы максимально сберечь 
силы и найти все русло за меньшее число шагов — бурений, т. е. 
хотелось бы каждую новую скважину бурить подальше от предыду- 
щих. Здесь придется искать компромисс между вероятностью успеха, 
новой скважины и стоимостью работ. Пробные бурения следует 
производить до появления успеха — действительного попадания 
на русло. 
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Шаг ТУ. Когда действительное положение русла будет найдено в таких проб- 
ных бурениях, эти данные следует запомнить как добытые знания, 
и нанести их на карту. После этого следует проверить «правило 
останова» — все ли мы нашли, что искали. Если найдено еще 
не все искомое русло, то перейти к шагу П и продолжить работу. 
Если же искомое русло реки найдено во всем требуемом объеме, то 
остановиться и писать отчет. 

Не надо думать, что этот алгоритм может быть реализован только с помо- 
щью интеллектуальных усилий образованного человека. Мы настаиваем, что 
этот же алгоритм может реализовываться автоматически и в нервной системе 
любого животного, а также в каких-то специальных физико-химических или 
генетических поисковых процессах любых организмов любой сложности. Так, 
шаг «сохрани знания» может реализоваться в таких процессах, где фикси- 
руется нечто найденное, которое затем может быть использовано вновь. Шаг 
«ищи новые знания» может реализоваться в процессе, содержащем, например, 
элемент пробного случайного выбора, и т. д. 

За этими, казалось бы, простыми шагами, скрываются, однако, большие 
проблемы. Вот некоторые из них. 


Априорная информация. Можно утверждать, что осуществить шаг [ без 
какой-либо априорной информации практически невозможно. Ведь для того, 
чтобы найти первые даже самые простые полезные знания о свойствах окру- 
жающего мира, надо располагать множеством ресурсов, посредством которых 
это можно осуществить. Так, надо иметь средства наблюдения, с помощью 
которых мы будем наблюдать окружающий мир — органы чувств, технические 
приборы — датчики, и эти средства заранее должны быть приспособлены 
к тем условиям, в которых они будут использоваться. Мы не можем иметь 
всех возможных органов чувств одновременно и не существует датчиков, ко- 
торые могут наблюдать и измерять все сразу. Надо располагать определенным 
временем, чтобы успеть произвести наблюдения. Ведь в природе существуют 
как очень скоротечные, так и очень медленные процессы, и если мы со 
своим конечным временем жизни не приспособлены заранее к временнбму 
масштабу важных для нас явлений, то мы не будем успевать осознавать те 
явления, которые очень быстры для нас, либо будем не в состоянии дождаться 
окончания очень медленных для нас процессов. Надо находиться в том месте 
пространства, где можно наблюдать искомые явления, и находиться там в 
то время, когда они происходят. Иначе нам может не хватить времени и сил 
для того, чтобы обнаружить эти искомые явления. Для того чтобы понять 
эти требования, представьте себе живой организм, оказавшийся при рождении 
в какой-нибудь совершенно необычной для его биологического вида среде, где 
действуют явления, для которых у него нет органов чувств, и явления эти 
очень скоротечны. Шансы выжить у этого организма будут ничтожно малыми. 

Если вернуться к примеру с геологом, то, очевидно, что без достаточной 
априорной информации он не сможет выполнить свою задачу. Если же ис- 
ходные данные есть, например, положение русла указано приблизительно, то 
в этом случае геолог проведет случайный поиск на данной территории, и, 
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возможно, найдет искомое. Если же априорных данных нет совсем, т.е. нет 
ни наблюдений, ни теории, то даже геолог-энтузиаст вскоре прекратит поиски. 
Потому что человек ограничен в своих возможностях и по силам, и по времени. 
Любой живой организм ограничен в своих ресурсах и в общем случае не 
способен к поиску методом простого случайного перебора. Поэтому можно 
полагать за правило, что априорная информация необходима всякому живому 
организму. 


Анализ априорной информации с целью выявления закономерностей 
в данных и знаниях, и обоснованное прогнозирование. Эта задача 
на житейском уровне решается человеком часто и более того — постоянно, 
и кажется легкой. Однако это решение почти всегда находится нами под- 
сознательно. Попытки решать эту задачу математически, даже с помощью 
компьютеров, сразу же показывают, насколько эта задача сложна. Доста- 
точно сказать, что с математической точки зрения поиск закономерностей 
и прогнозирование связываются с решением задач экстраполяции, анализа, 
данных, распознавания образов и других весьма сложных задач, которые 
отнюдь не всегда удается решить на практике. 


Представление информации — данных и знаний в памяти компьюте- 
ров. Это отдельная непростая задача, влекущая за собой и другие смежные 
проблемы. Например, такие, как проблема кодирования информации, сжатия 
информации, способов ее передачи, защиты, и т. д. 


Оптимизация системы с учетом априорной информации. Даже когда 
априорная информация имеется, ее эффективное использование — непростая 
задача. При построении технических систем для этой цели применяют раз- 
личные методы оптимизации. Пусть заранее известно, в каких условиях будет 
работать проектируемая система, и известно, какие ресурсы отпущены на 
реализацию системы. Тогда посредством методов оптимизации можно макси- 
мально эффективным способом распределить имеющиеся ресурсы, при этом, 
конечно, надо указать критерии, по которым оценивается эффективность 
системы. 


Эволюционная оптимизация. Будем предполагать, что в природе никто 
не оптимизирует живые организмы до их рождения по априорной информа- 
ции методами математической оптимизации. Насколько можно предполагать, 
в природе оптимизация организмов достигается посредством длительного эво- 
люционного отбора на множестве поколений организмов. Попытки моделиро- 
вания этого процесса составляют предмет отдельных современных научных 
направлений. 


Здесь мы перечислили только часть проблем, возникающих при попытке 
понять и воспроизвести в технических устройствах процесс добывания новых 
знаний. 

Вернемся к философии и рассмотрим некоторые якобы «непримиримые» 
направления теории познания, которые на наш взгляд различаются только 
вариантами задания начальных условий. 
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Первый вариант гносеологии представляет одну из крайностей и состоит 
в том, что к моменту рождения человека, в его мозг извне сразу записывается 
априорная информация об окружающем мире в некоторой форме. Инфор- 
мация в этой форме может называться «идеальными образами», «идеями». 
Далее в течение жизни человек соотносит эту имеющуюся у него априорную 
информацию с наблюдаемой им действительностью. Основной вопрос здесь — 
откуда появилась априорная информация, кто ее приносит человеку и в какой 
форме она представлена. Если говорят, что источник априорной информации 
является внешним по отношению к человеку, например, некоторый высший 
разум, то это соответствует идеалистической концепции философии. Фило- 
софские идеи, соответствующие этому подходу, связаны с именами Платона, 
Лейбница, Гегеля и многих других философов, относимых традицией к на- 
правлению «идеализма». 

Второй вариант гносеологи отражает другую крайность и заключается в 
том, что человек после рождения сам добывает информацию об окружаю- 
щем его мире, для чего необходимо практическое взаимодействие человека 
с окружающим миром, т. е. постоянные испытания этого мира — физические 
воздействия на него и анализ наблюдаемых откликов, при этом осваивается 
только та информация, которая попадает в поле зрения человека. В этом 
случае априорной информации нет, и необходимость во внешнем высшем ра- 
зуме отпадает. Тем самым сторонников этого направления вполне устраивает 
допущение, что выше человека разума нет (в смысле «бритвы Оккама», можно, 
конечно, отсечь в концепции то, без чего можно обойтись, но ведь между 
допущением и утверждением есть разница). Эта модель соответствует матери- 
алистической концепции философии. Идеи, соответствующие этому подходу, 
связаны с именами философов «материалистического» направления — Бэкона, 
Ламетри, Фейербаха и других. 

'Третий вариант является промежуточным, и именно его мы придержи- 
ваемся. Он состоит в том, что у всякой нервной системы любого организма 
имеется как некоторая априорная информация, так и необходимость само- 
стоятельного добывания дополнительной информации об окружающем мире, 
необходимой в первую очередь для выживания. 

Априорная информация просто необходима по следующей принципиальной 
причине. В теории распознавания известно, что не может существовать устрой- 
ства, которое могло бы в наблюдаемой им информации отыскивать абсолютно 
все имеющиеся в ней закономерности. Как невозможно представить себе дат- 
чик, который будет реагировать на все находящиеся в его поле зрения явле- 
ния — физические, химические, звуковые, событийные, ситуационные и др. 
Даже в случае, когда датчик наблюдает физически однородную информацию, 
всегда надо указать, что именно мы называем полезным сигналом, который 
следует регистрировать. Возможны только распознающие устройства, пред- 
назначенные для регистрации данных определенных видов, или, как говорят 
математики, — классов. Вот эти классы закономерностей или хотя бы правила, 
по которым они могут организовываться, и являются априорной информацией, 
и их надо определить каждому новому организму. При этом априорная инфор- 
мация может иметь различные источники. Например, это опыт предыдущих 
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поколений предков данного организма, найденный методом проб и ошибок, и в 
сжатой форме переданный новому организму (например, хромосомная теория 
наследственности). Другой источник — это действительно некоторый разум, 
внешний по отношению к данному организму. Вот возможные варианты такого 
внешнего разума: 


а) хромосомы содержат информацию, касающуюся определенного интер- 
вала жизни организмов предков хотя бы до их репродукционного пе- 
риода, тем самым новый организм в начале своей жизни уже имеет 
в своей хромосомной программе некоторую неосознаваемую им инфор- 
мацию о своем будущем в этом смысле, и эта информация является по 
отношению к сознанию организма уже внешним разумом; 

б) рядом с конкретным организмом, имеющим некоторый определенный 
возраст, как правило, живут индивиды более старшего возраста, которые 
могут разными способами передавать ему управляющую информацию, 
еще не добытую и не осознанную младшим организмом самостоятельно; 

в) не исключена и возможность существования в природе более продвину- 
тых, чем у человека, форм разума, оказывающих управляющие воздей- 
ствия на людей. 


Возможно, что имеются и другие источники априорной информации. Так 
или иначе, но если посмотреть на любой живой организм, то мы увидим, 
что он сильнейшим образом приспособлен к обычным для его вида условиям 
существования. Не только его «материальная часть» — органы чувств, все 
то, что составляет его тело, но и многие программы его поведения уже 
заложены в нем, переданы ему его предками через гены. Получить такую 
всеобъемлющую приспособленность можно только в течение очень большой 
предыстории всего вида, к которому принадлежит данный индивид. Это и есть 
априорная информация по отношению к конкретному организму. 

Однако одной априорной информации для жизни организма явно недо- 
статочно. Ему необходимо в течение жизни добывать и новую информацию. 
Дело в том, что среда, в которой мы живем, свойства окружающей нас 
природы не постоянны, не стационарны на протяжении жизни как биологи- 
ческих видов, так и отдельных организмов. Иногда медленно, иногда быстро, 
но они меняются. Приходят и уходят оледенения, поднимается и опускается 
дно океана, изменяется интенсивность солнечного излучения, от чего зависит 
количество тепла, поступающего от солнца, изменяется состав атмосферы, что 
существенно изменяет условия на поверхности Земли, изменяются пищевые 
цепочки в биоценозах, т.е. происходят непредвиденные изменения климала, 
флоры, фауны и кто знает, чего еще. Приспосабливаться, адаптироваться 
к изменяющимся условиям в биосфере жизненно необходимо для всех орга- 
низмов. Но даже если в Природе не происходят существенные глобальные 
изменения, то все равно каждый новорожденный организм вынужден при- 
спосабливаться ко многим и многим реалиям своей жизни. Предки животного 
могут передать своему детенышу информацию о том, что он родится в норе, 
будет передвигаться по ландшафту такого-то вида, будет питаться такой-то 
пищей и таким-то способом ее следует добывать. Эта информация будет 
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передана, посредством набора хромосом — генотипа этого организма, который 
и определит форму и рефлексы животного — его фенотин. Но предки не могут 
передать в генотипе точной информации о деталях той конкретной норы, 
в которой животное появится на свет, о плане того конкретного ландшафта, 
где ему предстоит охотиться и т. д. Всю эту информацию молодому животному 
придется добывать самостоятельно. И вот эта необходимость самостоятельного 
добывания недостающей информации в дополнение к уже имеющейся у него 
априорной информации с необходимостью требует, чтобы нервная система 
всякого живого организма отрабатывала программу добывания новых знаний, 
т.е. представляла собой механизм, реализующий познание. 

Здесь и вступает в силу тот вынужденный алгоритм процесса добывания 
новых знаний, который мы рассмотрели выше. Надо сказать, что алгоритм 
этот был получен материалистической философией и представляет собой 
вполне материалистическую процедуру получения знаний. Однако такая про- 
цедура добывания знаний мало зависит от наличия или отсутствия априорной 
информации, источником которой может быть что угодно, в том числе и разум 
более «высокий», чем человеческий, если такой существует в природе. 

Перейдем теперь к более подробному анализу тех общих условий, в которых 
работают нервные системы любых организмов. 
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Нервные системы в целом чрезмерно сложны для того, чтобы можно было 
рассмотреть в деталях их строение и функционирование. Тем не менее, опре- 
деленные детали и свойства поддаются наблюдению. Поэтому мозг уже не яв- 
ляется для нас «черным ящиком», как это было некогда. Анализируя то, что 
наблюдать можно, и дополняя такие наблюдения логическими выводами, рас- 
суждениями по аналогии, проверками гипотез с помощью математических мо- 
делей, можно сделать некоторые выводы о принципах работы мозга, которые 
далее следует всесторонне проверять, устанавливая степень их приближения 
к истине. 

Один и тот же объект можно рассматривать, изучать и моделировать 
с различных точек зрения, выявляя при этом различные его свойства. Нервные 
системы и мозг — это такие объекты, которые изучались и описывались 
многократно и с самых разных позиций (см. рис. 1.1). Как кибернетический 
объект, нервная система начала рассматриваться и моделироваться сравни- 
тельно недавно, в 40-е гг. ХХ в. Чрезвычайная сложность устройства нервных 
систем, их строения и выполняемых ими функций привели к разделению 
кибернетических наук на многие направления. Далеко ли или не очень далеко 
продвинулось каждое из таких направлений за прошедшие годы, но почти 
каждое из них создало свой язык описания, свой круг методов, свои постановки 
задач, и подчас специалисты разных направлений с трудом понимают друг 
друга, либо вовсе не стремятся к этому. По каждому из таких направлений 
работают многочисленные научные конференции, разбивая свои направления 
на поднаправления. Назовем только некоторые из таких направлений, дей- 
ствующих сегодня: «системы искусственного интеллекта», «системы адаптив- 
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ного управления», «системы подкрепляющего обучения», «системы распозна- 
вания», «анализ изображений и сцен», «системы анализа и синтеза речи», 
«нейронные сети», «эволюционная кибернетика», «робототехника», «эксперт- 
ные системы», «искусственная жизнь» и другие. 

Целью данной книги является описание авторской концепции модели нерв- 
ной системы. Создавая свою модель, мы стремимся не только ответить на во- 
прос «что именно происходит?» или «как именно это происходит?», но ста- 
раемся понять «почему это происходит именно так, а не иначе?»; считается, 
что модели именно такого типа являются наиболее полезными [1]. Однако мы 
понимаем, что сможем ответить на такой вопрос лишь частично. 

Для объяснений будем пользоваться теми же приемами, которые мы ис- 
пользовали сами при разработке этой модели, — описанием наблюдаемых 
свойств нервных систем, рассуждениями по аналогии, логическими выво- 
дами. Для того чтобы не отягощать книгу формализованными описаниями, 
мы не приводим здесь формул, доказательств теорем, описаний алгоритмов 
и результатов компьютерных экспериментов, которые опубликованы в статъях, 
к которым мы отсылаем заинтересованных читателей. В отличие от кратких 
статей в научных изданиях, форма книги позволяет, напротив, подробно из- 
ложить основные идеи и соображения, которые стоят за такими формулами 
и алгоритмами, что, как правило, невозможно сделать в статьях. 

Новые термины будем вводить по мере их появления, выделяя вновь 
введенный термин курсивом. Вот первый из них: модель нервной системы, 
которую мы разрабатываем, будем называть управляющей системой или 
сокращенно УС. 


2.1. Условие автономности 


Будем смотреть на среду как на множество элементов, связанных в некоторую 
структуру. Любой объект в среде — это подмножество элементов среды со 
своей структурой. Но мы будем называть структуру элементов обоектом 
только тогда, когда имеются некоторые механизмы, поддерживающие сохра- 
нение этого состава и структуры во времени. Например, произвольное подмно- 
жество молекул газа не есть объект, но конвективная ячейка, образующаяся в 
газе при определенных условиях нагревания, уже может рассматриваться как 
объект, поскольку существуют некоторые физические механизмы, поддержи- 
вающие целостность конвективной ячейки в течение некоторого времени. Как 
объекты могут пониматься облако, поток, камень, растение, живой организм, 
стая, семья, государство и т. п. 

Полезно подумать о том, как можно измерить сохранность некоторого объ- 
екта, одушевленного или неодушевленного тела. Какой смысл мы вкладываем 
в слова «это тот же самый дом», «это то же самое дерево», «это тот же 
самый человек», когда видим их спустя много лет после того, как видели 
их в последний раз? Мы говорим так, несмотря на то, что и тот дом сильно 
изменился, и то дерево выросло, и человек постарел. Очевидно, мы говорим так 
не потому что эти объекты не изменились совсем, а потому что некоторые их 
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свойства изменились не больше, чем мы это готовы допустить. У нас есть некие 
интуитивные критерии, позволяющие выносить суждения о тождественности 
вечно изменяющихся объектов самим себе. Дом может быть сильно перестроен, 
но если в нем остаются еще некоторые стены, окна, углы, куски знакомых 
обоев, мы готовы признать в нем тот же самый дом. Но если это «новодел», 
дом, заново выстроенный на том же месте, пусть и точно копирующий старый, 
мы, скорее всего, не захотим признать его. Дерево за несколько лет обновляет 
свои клетки в результате регенерации. Однако маленький росток и могучий 
трехсотлетний дуб следует признать одним и тем же деревом, если этот дуб 
вырос из этого ростка в процессе естесственного деления клеток под управ- 
лением одного и того же генетического материала. По некоторым данным 
(Йонас Фризен) клетки тела взрослого человека вследствие регенерации имеют 
средний возраст около 15 лет, кроме нейронов, клеток хрусталика глаза и, 
возможно, клеток сердечной мышцы. 

Итак, понятие целостности объекта можно формализовать с помощью 
введения правила, определяющего тождественность объекта самому себе в раз- 
ные моменты времени. Сформулировать правило тождественности для объ- 
екта — задача иногда нетривиальная, и, вообще говоря, зависит от цели и угла 
зрения. Далее мы еще вернемся к этому вопросу при рассмотрении правила 
тождественности для живого организма. А здесь отметим, что целостность, 
тождественность объекта могут обеспечиваться такими средствами, как: 


— физическими силами взаимодействия между элементами объекта, под- 
держивающими его структуру (например, атом, кристаллическая ре- 
шетка); 

— синергетическими механизмами самоорганизации материи (фракталь- 
ные структуры, волны); 

— центростремительными физическими процесами внутри объекта (шаро- 
вая молния); 

— распределенными физическими процессами в среде (конвективные про- 
цессы в газе); 

— целенаправленными усилиями чего-то или кого-то в среде, кто извне 
объекта хочет сохранить объект (удержание плазмы в магнитной ло- 
вушке токомака, усилия животного по поддержанию целостности своего 
гнезда); 

— и самый интересный случай — обеспечение целостности, тождественно- 
сти объекта усилиями специализированной подсистемы объекта — его 
бортовой, автономной системы управления (например, целенаправлен- 
ное обеспечение выживания организма, его нервной системой, мозгом). 


Нервная система есть, прежде всего, специализированная подсистема, по- 
явившаяся, возможно, как средство сохранения тождественности первичного, 
главного объекта — организма, специальная подсистема, целью которой яв- 
ляется поддержание целостности организма. Однако известно, что всякий 
биологический орган развивается и старается захватить больше ресурсов, 
эгоистически подчиняет себе соседние объекты. Можно высказать гипотезу, 
что нервная система, как подсистема, порожденная организмом специально 
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для того, чтобы поддерживать сохранение организма в среде, развившись, 
переросла свое назначение, и начала работать уже на сохранение в первую 
очередь самое себя. Подтверждение этого свойства мозга очевидно — мозг 
любого из нас с легкостью готов поменять свое тело, чуть только оно начинает 
терять свою форму, на более крепкое и красивое тело (элементарный при- 
мер — популярность пластических операций). Однако пока еще ни один живой 
организм не может переселять свой мозг в новое тело, и поэтому вынужден 
заботиться о сохранении своего тела. 

Если же эта «материалистическая» гипотеза о первичности тела неверна, 
а верна «идеалистическая» гипотеза о первичности разума, то это означает, 
что разум строит себе тело, как единственно возможный в этой среде способ 
своего существования, как свой «носитель». Но и в этом случае мозг вынужден 
заботиться о сохранении своего тела, при наблюдаемой нами невозможности 
сменить его. Поэтому будем считать наше построение инвариантным по от- 
ношению к главному вопросу философии — о первичности или вторичности 
разума по отношению к телу. 

Начнем рассматривать нервную систему с самых общих ее черт. Прежде 
всего, из сказанного следует, что всякая естественная нервная система обя- 
зательно встроена в тело организма и является как бы «бортовой» систе- 
мой управления. Даже в кошмарном сне мы не в состоянии представить 
себе нервную систему, мозг, работающий без тела. Литературная попытка 
вообразить и описать мозг, работающий отдельно от тела (при этом часть 
тела — голова, все же была сохранена), сделанная Александром Беляевым 
в романе «Голова профессора Доуэля», вызывала у читателей ужас своей 
противоестественностью. Здесь можно увидеть уже некоторое различие между 
естественной нервной системой и современными компьютерами — носителями 
того, что называют сегодня «искусственным интеллектом» (ИИ). Действи- 
тельно, системы ИИ ассоциируются скорее с программами для компьютеров, 
чем с какими-либо аппаратными их носителями, однако вряд ли кто станет 
утверждать, что они действительно похожи на нервные системы. Полагаясь 
даже на интуитивное ощущение того, что нервная система, мозг, не могут 
являться таковыми, не будучи частью некоторого тела, будем требовать, 
чтобы модель нервной системы, которую мы строим, обязательно обладала, 
некоторым «телом», и немного ниже мы укажем более серьезные обоснования 
этому требованию. Таким образом, принимаем, что искомая управляющая 
система (УС) обязательно должна представлять собой подсистему некоторого 
тела. Такое тело будем называть обоектом управления (ОУ). 

Тот факт, что УС является подсистемой ОУ и принимает управляющие 
решения самостоятельно, не получая непосредственных указаний извне, мы 
будем называть автономностью управляющей системы. В дальнейшем нас 
будут интересовать только управляющие системы, автономные в указанном 
смысле. Будем говорить, что рассматриваемые нами системы должны отвечать 
условию автономности. Заметим, что слово «автономность» может иметь 
много разных интерпретаций и поэтому обычно вызывает нарекания. Мы 
будем его понимать только в том смысле, который здесь указали, и не бо- 
лее того. 
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Среда 
ОУ 


Рис. 2.1. Система с автономным объектом управления, 
представленная в виде вложенных кругов Эйлера 


Если представлять системы и объекты математическими множествами 
составляющих их элементов, опуская временно их структуру, то можно 
изображать системы с помощью кругов Эйлера, иллюстрируя вложенность, 
пересечения, объединения или дополнения систем. Соответственно, для за- 
писи множественных отношений между системами можно использовать сим- 
волы П, О, С, є. Ниже мы приведем больше аргументов в поддержку дискрет- 
ного представления рассматриваемых систем. 

Так, на рис. 2.1 с помощью кругов Эйлера мы показали управляющую 
систему, которая является подсистемой объекта управления, который, в свою 
очередь, является подсистемой среды. Соответственно, можно записать 


УС с ОУ с Среда. 
Условие автономности управляющей системы у нас обозначает только, что 


УС с ОУ. 


Оговорка к условию автономности. Кажется, что всякое утверждение 
о нервной системе не может быть сделано без оговорок. Так, «условие ав- 
тономности» нервной системы может иметь следующие возражения. Нервная 
система является устройством для обработки информации и принятия реше- 
ний. Та часть входной информации, которая поступает в нервную систему 
извне, оказывает сильное влияние на многие принимаемые решения. Напри- 
мер, в случае появления опасности, организм начинает совершать действия, 
чтобы ее избежать. Можно, конечно, говорить, что эта входная информация 
была «управляющей» и, следовательно, нервная система не является авто- 
номной системой управления. Однако надо понимать, что в данном случае 
совершаемое организмом реактивное действие есть результат работы сложного 
алгоритма принятия решений, который, кроме того, опирался на уникальное 
содержимое памяти данного организма; распознавание организмом опасности 
явилось только «толчком» для начала работы алгоритма принятия решений, 
в этом смысле оно не имело значения управляющего указания, команды 
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или подсказки извне. Другое возражение относительно условия автономности 
может быть основано на примере, когда один организм дает целенаправленные 
команды другому организму, принуждая его выполнить то или иное действие. 
Но здесь мы тоже понимаем, что такие команды действуют не непосредственно 
на исполнительные системы организма-приемника, которые не могут их не 
выполнить. Напротив, эти «управляющие» команды воздействуют только опо- 
средованно, через «штатные» входы управляющей системы, и проходят весь 
путь от сенсоров, через систему распознавания, систему принятия решений 
и далее до исполнителей, а у организма остается «естественное» право не вы- 
полнять такие внешние приказы. Более того, организм является активным 
в большей степени, чем реактивным. Он принципиально может самостоятельно 
принимать решения в отсутствие внешних управляющих систем и управляю- 
щих команд. Активное управление требует много более сложной организации, 
чем управление реактивное. Все это иллюстрирует наше понятие автономно- 
сти. Примером неавтономного ОУ может являться, например, автоматическая 
станция «Луноход», которая управлялась с помощью команд, поступающих по 
телеметрическим каналам от оператора с Земли, а оператор мог пользоваться 
также помощью неограниченного штата советников, библиотеками и другими 
источниками знаний. 


2.2. Первая целевая функция автономной системы 
управления — выживание объекта управления 


Если управляющая система (УС) автономна, то из этого следует первая 
из пелей, которых УС добивается при управлении (обычно такие цели 
называют «целевыми функциями»). Эта, цель состоит в том, чтобы сохранить 
свой ОУ, свое тело хотя бы уже потому, что управляющая система может 
быть воплощена, реализована, только на некоторых материальных элементах, 
и этими элементами являются элементы и подсистемы тела ОУ. Так, биоло- 
гическая нервная система, реализована на нейронах, соединенных в нервные 
ткани — нервные сети. Такие сети нейронов представляют собой определенную 
часть тела организма. Они почти не могут перестраиваться, должны быть 
как-то закреплены в теле, получать от него питание, защиту и другую 
помощь. Но еще более тесным образом сеть нейронов связана своими входами 
с «датчиками» — органами чувств, поставляющими ей входную информацию, 
а также своими выходами с «исполнителями» — мышцами и железами (мы 
пока не будем рассматривать биологические процессы, связанные с пересоеди- 
нением нейронов в сети, хотя такие процессы имеют место, особенно на ранних 
стадиях формирования организмов). Даже более мелкие, чем нейроны, 
носители информации — нервные волокна, синапсы, сами нервные импульсы — 
материальны и сильно связаны с телом организма. Можно сказать, что 
знания, которые представляются нам сугубо информационной категорией, 
имеют, тем не менее, материальное воплощение в теле организма. Поэтому 
управляющая система, пытаясь сберечь свои знания, сберечь самое себя, тем 
самым вынуждена прилагать усилия, прежде всего — для сохранения тела, 
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т.е. для сохранения ОУ. А поскольку всякое тело ОУ представляет собой не что 
иное, как часть среды, состоит из элементов среды, тесным образом связано 
со средой и подчиняется ее законам, то УС вынуждена стремиться сохранить 
и среду, ее важные компоненты — свои семью, вид. Поэтому будем полагать, 
что одной из главных целевых функций УС, первой целевой функцией, 
является сохранение системы «среда — ОУ — УС», ее выживание. 
Очевидно, что не всякий объект может сохранять со временем свою 
тождественность. Таким свойством могут обладать только специально ор- 
ганизованные объекты. Можно полагать, что долго сохранять себя как 
целое в агрессивной среде может только сложноорганизованный объект, 
в котором имеется управление, т.е. его части подчинены действию неко- 
торых объединяющих сил и обратных связей. Примерами могут служить: 
элементарная частица, растение, планета, солнечная система, живой ор- 
ганизм. Твердый минерал тоже способен долго сохранять себя в агрес- 
сивной среде. И хотя он тоже представляет собой систему — высоко- 
прочную кристаллическую решетку, объединенную взаимосвязанными меж- 
атомными силами, все же эта система состоит из однородных элементов, 
не специализированных, не имеющих своих специальных функций в си- 
стеме. Так, можно отломить от минерала половину и каждая половина 
останется минералом. Поэтому растения и живые организмы мы выделим 
особо, поскольку здесь мы в состоянии видеть, что они выживают бла- 
годаря своему поведению, специально направленному на достижение этой 
цели, т. е. поведению, имеющему целевую функцию выживания. Такое пове- 
дение мы и будем рассматривать в этой книге. Заметим также, что слож- 
ноорганизованные объекты, имеющие целевые функции и способы их до- 
стижения, часто называют «системами». Мы под системой везде ниже, 
кроме специально оговоренных случаев, будем понимать тройку объектов 


«среда — ОУ — УС». 
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Еще раз вернемся к вопросу о тождественности объектов, но рассмотрим те- 
перь объекты, которые содержат в себе автономную систему управления. Пока 
единственным примером такого объекта является живой организм, например, 
человек (это единственный на сегодняшний день объект, ощущения которого 
мы можем проанализировать «изнутри»). Попробуем сформулировать пра- 
вило тождествености для человека. Отчасти эта задача, совпадает с пробле- 
мой идентификации личности, которой так озабочены охранные организации. 
Последние предлагают решение в виде регистрации некоторых уникальных 
параметров тела человека: антропометрических характеристик, отпечатков 
пальцев, картинок радужной оболочки глаз. Усердно придумываются и другие 
признаки. Но, как известно, все эти признаки при необходимости подделыва- 
ются. На самом деле, даже охранные организации согласятся, что они хотят 
не пропустить на охраняемую территорию не определенное тело, обладающее 
такими-то признаками, а они хотят не пропустить туда находящийся внутри 
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этого тела определенный автономный интеллект, являющийся в данном слу- 
чае злонамеренным противником, который может совершить на охраняемой 
территории некоторые нежелательные действия. Противник с удовольствием 
воспользовался бы возможностью переноса своего интеллекта в новое тело, 
которое не вызовет подозрений у охранной системы, поскольку оно не имеет 
признаков, относящихся к классу «чужой», но такой возможности пока нет, 
хотя используются ее частичные заменители типа, переодевания, пластиче- 
ских операций, пересадки кожи с другими отпечатками пальцев и другими 
подобными обманами. Применяется пересадка пока не интеллекта, но хотя бы 
датчиков в новое тело. Так, однажды на охраняемом объекте была обнаружена, 
собака, вместо глаза которой была вмонтирована фотокамера. В последнее 
время появились и возможности частичной пересадки «вражеского» интел- 
лекта в искусственное тело — в мобильные и летающие роботы, которые, 
проникая на охраняемую территорию, совершают там нежелательные для 
охранной системы действия. Шерлок Холмс, увидев такого робота, вполне 
мог бы воскликнуть: «Смотрите, Ватсон, это он — профессор Мориарти!». 
Итак, критерий тождественности такого интеллектуального объекта, как че- 
ловек, должен быть связан уже не столько с составом и структурой, как 
у неодушевленной материи, и даже не с генетическим кодом, как у растений, 
но с информацией, со знаниями. 

Представим два фантастических варианта встречи со своим старым зна- 
комым. Пусть мы видим человека с тем же знакомым телом, но с другим, 
пересаженным ему мозгом. Второй вариант — мы видим совершенно новое 
тело, пусть даже это будет компьютер, но с мозгом знакомого нам человека. 
Которого из них мы признаем за своего старого знакомого? Мне кажется, что 
в этом случае более важна сохранность именно мозга. Потому что именно 
в этом случае можно спросить нашего знакомого: «а ты помнишь, как мы 
с тобой ловили карасей в дачном пруду?». Прежнее тело с новым мозгом для 
нас не будет представлять интереса в этом смысле. 

Значит, в неживом для нас важна сохранность самой материи, в живом 
для нас важна преемственность формообразующей структуры естественно 
растущего тела (растения), а в одушевленном теле важна преемственность 
непрерывно изменяющихся знаний, носителем которых является данное суще- 
ство. Видимо, в каждом случае можно как-то указать на допустимый объем 
возможных изменений соответственно материи, структуры или прерывности 
знаний (о причинно-следственной связи событий). 

Однако пример с пересаженным мозгом следует признать все же нереаль- 
ным, потому что, как было сказано выше, знания в организме неотделимы от 
их материального носителя — тела. Еще больше в этом мнении может укрепить 
следующее соображение. Организм постоянно находится во взаимодействии 
с окружающим миром. Мозг организма реагирует на воздействия на него 
среды и тела, а окружающий мир, в свою очередь, реагирует на воздействия 
на него тела организма как исполнителя команд его мозга. Даже если мы 
абсолютно точно перенесем знания из одного тела в другое, и это новое 
тело совершит то же очередное действие, которое сделало бы старое тело, то 
реакция окружающего мира будет уже иной. Потому что окружающий мир 
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реагирует на действия разных тел по-разному. Представьте, что один и тот 
же жест сделают мужчина, женщина, ребенок, старик или робот. Один и тот 
же наблюдатель отреагирует на этот жест совершенно по-разному, и мозги 
этих различных тел получат различную реакцию на одинаковое предыдущее 
действие, и с этого момента пересаженный мозг вынужден будет развиваться 
своим собственным путем, уже не похожим на тот путь, по которому он 
развивался бы в старом теле. Другой пример — управление в организме 
во многом подчинено задаче управления движением тела. Нервная система 
постепенно учится управлять данным ей телом. Она постепенно понимает, 
какое именно усилие надо приложить к мышцам, чтобы данное тело со- 
вершило требуемое движение. Представьте себе, что обученной нервной си- 
стеме подменили тело, например, заменили его более массивным — тогда 
команды, которые будет давать нервная система в соответствие со старыми 
навыками, не будут приводить к желаемому результату, и системе потребуется 
переобучение. 

Поэтому будем говорить, что наблюдаемый нами в текущий момент орга- 
низм (ОУ) тождественен прежде наблюдавшемуся нами организму, если мозг 
первого есть результат естественного непрерывного развития мозга прежнего 
организма, а новое тело также есть результат естественного непрерывного 
развития прежнего тела. Это есть наш критерий тождественности ОУ. 

Под «естественным» развитием нервной системы организма здесь интуи- 
тивно хочется понимать следующий процесс. Нервная система в реальном 
времени жизни организма реализует одновременно два процесса — обу- 
чение и управление. Обучение состоит в попытке обнаружения причинно- 
следственных связей между событиями в системе и теми действиями, которые 
совершает организм. Очевидно, что обучение совершается на «новом» матери- 
але, который постепенно подбрасывает система. Можно говорить о некоторой 
пропорции между детерминированной, предсказуемой управляющей системой 
компонентой событий, и случайной, неожиданной для нее компонентой. 
Например, прогнозируя и совершая некоторую прогулку по местности, нервная 
система прогнозирует некоторый результат этой прогулки, хотя в ходе нее 
могут возникнуть и многие сравнительно маловероятные мелкие непредска- 
занные события, не нарушающие в целом задуманного плана, но служащие 
развитию нервной системы. Это можно понимать как «естественный» ход 
событий. Однако если прогулка закончится неким событием, совершенно 
не укладывающимся в понимание нервной системой причинно-следственных 
связей, особенно причинно-следственных связей решений и действий нервной 
системы и реакций среды, то это может вызвать нарушение «естественного» 
хода развития нервной системы. Так, насилия, катастрофы, болезни могут 
изменить нормальный ход развития мозга, начнется его болезнь, патология; 
это будет мозг, уже «неправильный», не тождественный прежнему мозгу; мы 
будем сожалеть, что это произошло с организмом; мы будем сожалеть о нем 
как об организме пропавшем, ставшим другим. 

Тем самым мы определили первое условие — «условие автономности» УС 
и первую целевую функцию управляющей системы — сохранение тождествен- 
ности объекта управления, его выживание. 
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2.4. Условие дискретности 


Теперь введем второе условие, которому должна соответствовать УС как мо- 
дель нервной системы. Это условие дискретности. Нервная система является 
очень сложным образованием, в котором протекает множество процессов. Это 
и метаболические, био-химические, электро-химические и другие процессы, 
которые имеют непрерывный характер. Однако основной функцией управ- 
ляющей системы является управление. В своей основе сложное управление, 
которое опирается на такие процедуры, как распознавание образов и принятие 
решений, должно содержать в себе признаки логического процесса. В свою 
очередь, логика оперирует дискретными логическими элементами, такими как 
логические переменные, имеющие два значения — «истина» или «ложь» (ино- 
гда используют такие обозначения, как «И» и «Л», «да» и «нет», или 1и 0). 
По-видимому, именно поэтому основные детали нервной системы приобрели 
такой вид, который заставляет нас видеть в ней в первую очередь дискретное 
устройство. Так, нервные системы всех организмов состоят из дискретных 
элементов — нейронов, соединенных в сети. Нервная сеть имеет конечное число 
дискретных входов — афферентных, оснащенных специализированными клет- 
ками — рецепторами, и конечное число дискретных выходов — эфферентных 
нервных волокон, возбуждающих исполнительные органы — мышцы и железы. 
Как бы много ни было нейронов в мозге (мозг человека состоит из 101 
нейронов и 1014 связей между ними), но число их конечно. Это же касается 
рецепторов и исполнителей. Более того, принцип действия нервной сети тоже 
может быть охарактеризован как дискретный. Нейроны обмениваются между 
собой одинаковыми по форме сигналами, имеющими вид дискретных нервных 
импульсов, как сети цифровой связи. Таким образом, и строение и функцио- 
нирование нервной сети являются во многих отношениях дискретными. 


Оговорка к условию дискретности. С определенностью можно утвер- 
ждать, что в управлении, осуществляемом нервной системой, участвуют 
не только дискретные, но и непрерывные процессы. Так, непрерывный харак- 
тер имеет значение частоты, с которой нейрон может генерировать импульсы. 
Известно, что частота генерируемых нейроном импульсов несет важную ин- 
формацию. Например, частота импульсов (потенциалов действия), которыми 
рецепторная нервная клетка реагирует на раздражитель, сообщает о силе раз- 
дражения и иногда даже о характере раздражителя (например, раздражение 
кислотой или щелочью вызывает различную частоту следования импульсов). 

Другой пример — непрерывный характер имеют изменяющиеся размеры 
синапсов (синапсом называется контакт, соединяющий два нейрона друг с дру- 
гом, и передающий нервные импульсы между этими нейронами). Возможно, 
что существование непрерывных элементов и процессов в нервной системе 
связано и с таким вопросом (заданным автору Ю. В. Тюменцевым): можно 
ли все множество непрерывных явлений в окружающей среде отобразить 
в нервной системе только с помощью дискретных процессов? Частично от- 
вет на этот вопрос дает теорема [2] А. Н. Колмогорова о представимости 
непрерывных функций. Нам представляется, тем не менее, что как бы ни 
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был богат способ представления информации в нервной системе и мозге 
с помощью нервных импульсов, он должен иметь свои ограничения. Они 
проявляются в том, что мы не можем представить себе некоторых явлений, 
существующих в окружающем мире. Например, мы не можем представить 
себе размеров астрономических объектов — звезд, галактик. Когда мы ду- 
маем о них, мы мысленно редуцируем размеры образов этих объектов до 
размеров привычных нам вещей. Так, астрофизик И. С. Шкловский в своей 
замечательной книге «Вселенная, жизнь, разум» [3] писал, что когда он за- 
нимался солнечной короной и Галактикой, то и та и другая представлялись 
ему «неправильной формы сфероидальными телами примерно одинаковых 
размеров — что-нибудь около 10 см...». Хотя солнечная корона — объект 
огромных размеров, а размеры галактической короны в сотни миллиардов раз 
больше, чем размеры солнечной. Мы не можем представить себе размеров 
элементарных частиц, и когда думаем о них, то тоже представляем их себе 
как объект, который можно подержать на ладони, примерно так, как мы 
держим вишню. Мы не можем представить себе и гораздо более простые вещи. 
Например, — как видит змея в инфракрасном диапазоне. Человек с нормаль- 
ным цветовосприятием не может представить себе, как видит мир дальтоник, 
не различающий красного цвета. Мы не можем представить себе трехмерные 
фигуры, нарисованные художником Эшером, хотя некоторые из них можно 
построить физически. Такая неспособность нервной системы представлять 
себе объекты непривычных масштабов, непривычной топологии, или процессы, 
происходящие в непривычных средах — вполне понятна. Ведь нервная система, 
человека приспосабливалась к жизни во вполне конкретной физической среде. 
И в результате естественного отбора она специализировалась на том, чтобы 
иметь дело с такими объектами и процессами, которые наиболее важны для 
жизни человека. Неспособность своей нервной системы отображать те или 
иные объекты или процессы человек компенсирует выработкой абстрактных 
образов, моделей, формальных описаний. Все равно, следует понимать, что 
возможности человеческого мозга порождать образы явлений, хотя и очень 
широки, но ограничены. Тем не менее в своих моделях мы будем стараться 
придерживаться именно условия дискретности. 

Принимая условие дискретности, теперь можно дополнить рис. 2.1, по- 
требовав, чтобы управляющая система (УС) представляла собой дискретное 
устройство. Тогда соответствующая схема приобретает вид, изображенный на 
рис. 2.2. 

Условие дискретности вынужденно заставляет нас предположить у нервной 
системы целый ряд свойств и ввести целый ряд ограничений. 

Для определенности будем полагать, что дискретные элементы в УС соеди- 
нены между собой с помощью направленных связей, т. е. связей, передающих 
сигналы только в одну сторону. К одному элементу может подходить несколько 
связей, и несколько связей может от него отходить. Такую структуру в мате- 
матике принято описывать ориентированным графом, состоящим из вершин 
и соединяющих их дуг. Количество всех входных и выходных связей элемента 
будем называть арностью этого элемента, число входных связей элемента — 
его входной арностью, а число выходных связей — выходной арностью. Эле- 
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Рис. 2.2. Дискретная управляющая система имеет конечные множества элементов, 
связей, входов и выходов. По связям передаются дискретные однотипные сигналы — 
импульсы 


мент с входной арпостъю, равной нулю, будем называть истоком. Элемент 
с выходной арностью, равной нулю, будем называть стоком. По входным 
связям в элемент в виде набора сигналов поступает входная информация, 
которая преобразуется элементом по некоторым правилам (назовем их зако- 
ном функционирования элемента) в выходную информацию, выходящую от 
элемента по его выходным связям в виде выходных сигналов. Для истоков 
закон функционирования не определен, потому что входных сигналов у истока 
нет, и его выходные сигналы вырабатываются некоторым случайным способом. 
Истоки будем использовать при описании генераторов случайных воздействий, 
которые должны присутствовать в нашей системе. Всякий подграф, состоящий 
из нескольких элементов и их связей, можно заменить одним элементом 
с соответствующими входными и выходными связями. По сути, этот элемент 
будет представлять собой подсистему. Соответственно, всякий элемент, если 
обнаружатся его подэлементы, при необходимости можно заменить подгра- 
фом, подсистемой, состоящей из нескольких элементов. 

В нервной системе выходным связям такого элемента, как нейрон, соответ- 
ствует только один «выходной» отросток нейрона, — аксон. Поскольку аксон 
может иметь множество ответвлений — коллатералей, то выходной арностью 
нейрона будем называть число ответвлений его аксона, хотя все эти ответвле- 
ния просто размножают один выходной сигнал (однако к синаптическим окон- 
чаниям ответвлений сигналы могут приходить уже в разное время из-за разной 
длины ответвлений). Если речь будет идти об элементе, представляющем собой 
целую подсистему, то в этом случае разные его выходы могут нести разные 
сигналы. Здесь следует также еще раз заострить внимание на следующем об- 
стоятельстве. Если мы под элементами УС понимаем нейроны, то полезно пом- 
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нить, что нейроны могут воздействовать друг на друга не только с помощью 
нервных волокон, но и посредством специальных химических соединений — 
медиаторов, играющих важную роль при передаче сигналов. Также можно 
предположить, что между нейронами в нервной системе существуют связи 
и другой физической природы, например, посредством электромагнитных 
полей. Такие взаимодействия действительно оказывают влияние на работу 
нервной системы. Интересно то, что ниже мы увидим необходимость такого 
рода взаимодействия между нейронами. Например, в этой же главе, где речь 
идет об определении нервной системой времени принятия решений, ограниче- 
ние круга активных нейронов вполне может осуществляться с помощью меди- 
аторов, выделяющихся в межклеточную среду или иным подобным способом. 
Может возникать необходимость передачи информации через внешнюю среду, 
например, между различными синапсами. Так в предлагаемой нами модели 
нейрона типа Ш взаимодействие между синапсами нейрона может осуществ- 
ляться тоже с помощью медиаторов через межклеточную среду. Однако эти 
механизмы мы вынуждены исключить из нашей модели, сосредоточившись 
только на одном виде взаимодействия между нейронами — на взаимодействии 
с помощью нервных импульсов. Граф на рис. 2.2 условно отображает нервную 
систему только в некотором ее физическом плане, именно, как множество 
нейронов и нервных волокон, по которым передаются нервные импульсы. Это 
множество объектов, работающих только с бинарной информацией в виде 
нервных импульсов. Тем самым мы понимаем УС, т. е. нервную систему, мозг, 
как специализированную систему, предназначенную для логической обработки 
бинарной информации, представленной в виде нервных импульсов. 

На рис. 2.2 мы не показали такие элементы ОУ, как датчики и исполнители, 
потому что они работают уже не только с бинарной информацией. Так, дат- 
чики преобразуют различные физические воздействия, в том числе непрерыв- 
ные, в «бинарные» нервные импульсы, являющиеся входными для УС, а испол- 
нительные органы преобразуют «бинарные» выходные нервные импульсы УС 
в различные физические процессы. 

Исходя из сказанного, множество всех связей в УС (см. рис. 2.2), т.е. множе- 
ство всех дуг графа, представляющего УС, можно подразделить на следующие 
три подмножества: 


а) связи, соединяющие элементы, лежащие внутри УС; 
б) связи, идущие из ОУ в УС; 
в) связи, идущие из УС в ОУ. 


Связи (а) — это нервные волокна между нейронами, связи (6) — нервные 
волокна, идущие от выходов рецепторов к нейронам нервной сети, а связи (в) — 
нервные волокна, идущие от нейронов сети к исполняющим органам. Связи 
в случаях (б) и (в) пересекают границу между УС и ОУ. Конечно, здесь под ОУ 
мы понимаем ту его часть, которая лежит вне управляющей системы, ОУ\УС, 
хотя, строго говоря, УС есть часть ОУ. 

Если мы вводим в рассмотрение дискретные сигналы, то необходимо опре- 
делить также дискретное время. Шаг Лё, с которым изменяется дискретное 
время &, ДЕ = Ё; - &, может быть для разных случаев либо строго фикси- 
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рован, либо быть относительно произвольным. Если речь идет о некотором 
динамическом процессе, строго закономерным образом развивающемся во 
времени, то интервал А? между двумя событиями должен быть строго фик- 
сированным. Существуют причинно-следственные процессы, в которых важна 
не длительность интервала времени между событиями, а только очередность 
наступления событий. Существуют также процессы, в которых временная 
привязка, событий вообще не важна, важно только само наличие событий. 

Примерами первых являются процессы распознавания и управления ло- 
комоционными явлениями, где работа системы распознавания и принятия 
решений должна быть строго согласована по времени с поступлением сигналов 
от датчиков и с выдачей сигналов исполнителям. Действительно, известно, 
что в нервной системе имеются специальные подсистемы, задающие ритмы 
импульсов с некоторым постоянным интервалом Д$. Такие ритмоводители, на- 
пример, синхронизируют работу датчиков и распознающих подсистем, управ- 
ляют работой исполнительных устройств (например, пейсмекер, управляющий 
ритмической работой сердечной мышцы — миокарда). 

Примером дискретного временного процесса, где величина Аё может быть 
не строго фиксированной, является процесс распознавания человеком букв при 
чтении текста. Не так важно, с какой скоростью следует распознавание каждой 
буквы, более важна именно очередность распознаваемых букв. 

Наконец, примером процесса, в котором время и очередность наступления 
событий не существенны, является распознавание геометрических фигур — 
не важно, в каком порядке были распознаны отдельные составляющие этой 
фигуры, важно лишь их наличие. 

Мы будем использовать дискретное время для моделирования процессов 
каждого из указанных видов. 


2.5. Датчики 


Посмотрим на УС с общей точки зрения. С одной стороны, УС является систе- 
мой, осуществляющей управление на основе предсказания событий, а также 
системой, управляющей событиями на основе знания их свойств. С другой 
стороны, УС является системой, преобразующей информацию. Поэтому она 
должна состоять из трех основных частей (см. рис. 2.3): 


а) части, воспринимающей информацию из среды, распознающей ее и пе- 
редающей в УС в некоторой закодированной форме; 

б) части, представляющей собой некоторую функциональную память, осу- 
ществляющую сравнение поступившей внешней информации с внутрен- 
ней информацией, уже хранящейся в памяти; 

в) части, принимающей решение на основе результатов сравнения, вывод 
этой результирующей информации наружу, в среду и ее реализацию 
в виде воздействий. 

Очевидно, что чем эффективнее будет воспринимающе-распознающая 


часть, тем успешнее будет работать УС. Входящая в УС информация отобра- 
жает непрерывный многомерный поток пространственно-временных событий, 
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Рис. 2.3. Около половины управляющей системы должно приходиться 
на ее самообучаемую распознающую часть 


в которые вовлечен ОУ. При этом УС должна не просто распознавать некие 
заранее заданные образы в этом потоке информации, но должна постоянно об- 
наруживать в нем новые, ранее неизвестные ей образы и затем учиться распо- 
знавать их. Иначе говоря, речь идет о самообучаемой системе распознавания, 
которая сама должна формировать «алфавит» распознаваемых ею классов- 
образов. Предсказание будущего (относительно текущего момента времени) 
поведения всякого временного ряда, его экстраполяция, требует тщательного 
анализа, (распознавания особенностей) поведения ряда в прошлом, приведшем 
этот процесс к текущему моменту времени. Такой анализ прошлого будет тем 
более глубок и полезен для предсказания, чем больше различных характе- 
ристик этого ряда мы рассмотрим и проанализируем. Конечно, мы исходим 
из того, что данный ряд отражает некоторый закономерный процесс очень 
большой сложности, содержащий в себе большое число детерминированных 
процессов. Известной частью этих процессов управляющей системе «хотелось 
бы» пользоваться для управления, а неизвестную их часть, воспринимаемую 
в виде случайной компоненты, управляющей системе и «хотелось бы узнать». 

Специалисты по обработке временных рядов знают, что текущее значение 
временного ряда можно характеризовать множеством параметров. Это и его 
абсолютная величина, и 1-я, 2-я, 3-я и т. д. производные, и 1-й, 2-й ит. д. 
статистические моменты, и наличие и характер трендов, и характеристики 
шумовой компоненты и т. д., т.е. множество специальных образов, которые 
выработаны специалистами для описания характеристик интересующих их 
временных рядов в той или иной предметной области. 

Природа, как конструктор такой распознающей системы, тоже заинтересо- 
вана в получении этого рода информации. Поэтому она изобрела специальные 
органы, выполняющие роль систем распознавания, это органы чувств. Рецеп- 
торные клетки, составляющие основу органов чувств, фактически распознают 
такие характеристики входного временного ряда данных, как его абсолютная 
величина (0-я производная) и приращение (1-я производная) — это так на- 
зываемые «тонические» и «фазические» рецепторные клетки, которые будут 
рассмотрены ниже. Почему же природа не изобрела датчиков для оценивания 
2-й, 3-й и других производных временных рядов, а также для оценивания 
других характеристик? Ответ простой: для оценивания или распознавания 
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такого рода характеристик нужны уже более сложные устройства, имеющие 
внутреннюю память. Например, простой оценкой 1-й производной изменяемой 
во времени величины 2(Р) является разность двух значений текущей вели- 
чины — последней и предпоследней, отнесенной к интервалу времени между 


ними: 
ах 2(0) —т@-А® 
а ДЕ | 
Датчику для регистрации такой оценки нужна одна ячейка памяти для хране- 
ния предыдущего значения величины 2(#— Д®). Технически изобрести датчики 
такого рода сравнительно просто. Но вот для регистрации 2-й производной 


датчику понадобятся уже две ячейки памяти для хранения значений 
2Е-А и 10-245. 


Сделать это в одной биологической клетке оказалось не так-то просто. При- 
рода как бы «поняла», что проще изобрести набор деталей — «конструктор» 
для конструирования датчиков, способных распознавать и регистрировать и 
2-ю и 3-ю и другие производные, а также и всевозможные иные образы. Этот 
конструктор должен состоять из элементов задержки и элементов памяти. 
Кроме того, поскольку от такой системы распознавания требуется еще быть 
самообучаемой в соответствии с некоторыми правилами, то в конструктор 
должны быть добавлены элементы памяти для накопления статистики и функ- 
циональные элементы памяти, для хранения и применения правил формиро- 
вания образов. Такой «конструктор» природа успешно изобрела. Элементами 
этого конструктора являются нейроны, синапсы и нервные волокна, что вместе 
с реценторными клетками и их надстройками — вспомогательными структу- 
рами, осуществляющими предварительный отбор и фокусировку физических 
воздействий на рецепторные клетки, позволяет распознавать очень сложные 
характеристики наблюдаемых пространственно-временных процессов. 
Итак, сенсорной системой УС живого организма является совокупность: 


— вспомогательных органных морфологических структур, осуществляю- 
щих коллимацию, фильтрацию и фокусировку требуемого физического 
воздействия на рецепторные клетки; 

— тонических или фазических рецепторных клеток, преобразующих сфо- 
кусированные на них физические воздействия различной физической 
природы в однотипные стандартизованные импульсы, говорящие УС 
о распознавании ими лежащей в определенных рамках абсолютной ве- 
личины (0-й производной) данного воздействия, либо об определенном 
его приращении (1-й производной); 

— прилегающей к ним сети нейронов, осуществляющих распознавание 2-й 
производной и других нужных данной УС характеристик (образов), 
которые отбираются ею за счет того, что нейроны работают в режиме 
самообучения. 

В качестве примера того, что в живом организме трудно провести границу 

между собственно датчиками и частью нервной системы, решающей задачу 
распознавания, приведем глаз человека, где рецепторные клетки — палочки 
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и колбочки непосредственно связаны с трехслойной сетью нервных клеток, 
устилающих дно глазного яблока. Эта распознающая нейросеть содержит мил- 
лионы нейронов. Трудно сказать, часть ли мозга вынесена в глазное яблоко, 
или глаз — это такой сложный датчик, включающий огромную нейросеть. 
По нашему мнению, это деление условное, и распознающая система, начинаясь 
с датчиков, уходит далеко вглубь нервной системы, составляя, может быть, 
половину мозга. Датчик — это только начало системы распознавания, и работу 
собственно рецепторных клеток всегда необходимо рассматривалъ в комплексе 
с нейронными структурами. 

Согласно сказанному здесь, всю воспринимающую часть системы мы 
условно разделим на две подсистемы — на блок датчиков, куда отнесем 
вспомогательные структуры и рецепторные клетки-сенсоры, и систему фор- 
мирования и распознавания образов (ФРО), состоящую из сети самообучаемых 
распознающих нейронов, примыкающих к сенсорам. 

Проблемы и вопросы распознавания, связанные с нейронами системы ФРО, 
будут нами рассматриваться ниже, а в этом разделе остановимся подробнее 
на вопросах, связанных именно с рецепторными клетками — с блоком датчи- 
ков, которые являются хотя и важной, но не решающей частью распознающей 
системы живого организма. 

Поскольку мы приняли, что нервная система является дискретным устрой- 
ством, то отсюда следует, что ОУ должен иметь блок датчиков (БД), назна- 
чение которого — отображать некоторые как дискретные, так и непрерывные 
физические воздействия и явления окружающей среды в управляющую си- 
стему в виде дискретных «бинарных» нервных импульсов. Будем полагать, что 
«входными полюсами» нервной системы как дискретного устройства являются 
аксоны рецепторных клеток. Число таких входных полюсов очень велико, 
но конечно. 

Очевидно, что для управления УС нужна информация о состояниях и про- 
цессах, происходящих не только в окружающей среде, но и в самом ОУ. 
Биологи в связи с этим говорят о внутренней среде. Поэтому часть датчиков 
расположена в теле самого ОУ. Ниже мы не будем без особой необходимости 
разделять внешнюю и внутреннюю среду. 

Не все воздействия среды на ОУ регистрируются датчиками. О каждом 
организме можно сказать, что существуют такие воздействия среды, для 
регистрации которых у организма нет датчиков (например, человек не слышит 
ультразвук, не видит инфракрасное излучение, не чувствует некоторых изме- 
нений внутри своего тела). Однако нельзя утверждать, что воздействия среды, 
которые не регистрируются датчиками, не влияют на организм. Например, 
радиация не чувствуется человеком непосредственно, но сильно влияет на его 
здоровье. Видимо, в процессе эволюционного отбора в организмах формиру- 
ются датчики для наиболее существенных для данного организма воздействий 
его внешней и внутренней среды. Нарис. 2.4 условно изобразим множество воз- 
действий среды на организм. Информация только о некоторых воздействиях 
регистрируется датчиками (большие треугольники на рисунке) и передается 
в нервную систему (УС). Часть воздействий не регистрируется датчиками 
либо потому, что они выходят за пределы чувствительности датчиков, либо 
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Рис. 2.4. Организм располагает датчиками для регистрации только некоторых 

из воздействий среды (датчики изображены большими треугольниками) и пере- 

дачи информации о них на входные полюса УС (маленькие треугольники). Часть 

воздействий среды действует на организм, но не регистрируется датчиками. Часть 
процессов среды совсем не воздействует на организм 


потому, что соответствующие датчики отсутствуют. Однако некоторые из 
таких воздействий могут оказывать существенное воздействие на организм. 
Кроме того, на рис. 2.4 показаны воздействия среды, проходящие как бы 
мимо организма. Это процессы, проходящие в среде, но не воздействующие 
на организм. Хотя такие процессы нельзя отнести собственно к воздействиям 
среды, однако мы хотели все же обратить внимание на их существование, хотя 
бы уже потому, что часть из них могла быть порождена самим организмом. 

Таким образом, мы можем говорить о существовании «наблюдаемых» 
и «ненаблюдаемых» управляющей системой воздействий среды. Заметим 
также, что в некоторых случаях УС может получать косвенную информацию 
о ненаблюдаемых воздействиях. Для этого УС может использовать какие-либо 
объекты естественного или искусственного происхождения, играющие роль 
косвенных датчиков. Такие косвенные датчики отображают ненаблюдаемую 
информацию на имеющиеся у организма датчики, делая ее косвенно наблюда- 
емой. Например, животное, которое не в состоянии видеть приближающегося 
хищника, может «пользоваться» сухими ветками деревьев, треск которых, 
регистрируемый слухом животного, несет информацию о приближающейся 
опасности. Человек изобрел множество приборов для регистрации тех воз- 
действий внешней и внутренней среды, которые он не может регистрировать 
своими естественными датчиками. 

Поскольку нас будет интересовать процесс управления, осуществляе- 
мый УС, то необходимо принимать во внимание также следующее обстоя- 
тельство. Не вся «наблюдаемая» УС информация участвует в управлении. 
Другими словами, когда УС принимает решение, она учитывает не всю инфор- 
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мацию, поступающую к ней от датчиков. Это выглядит так, будто УС до неко- 
торого времени «не знает» о существовании некоторой части своих датчиков, 
не контролирует их. Например, человек, у которого ни разу не болела печень, 
при принятии решений о меню своего обеда не учитывает того, что слишком 
жирная пища может вызвать впоследствии ощущение боли в печени. У такого 
человека датчики в печени имеются и работают исправно, но именно потому 
что он ни разу не чувствовал боли в печени, он, возможно, даже не знает о ее 
существовании и никогда не заботится о ней, для него эти параметры являются 
«неконтролируемыми». Но стоит человеку переболеть гепатитом, как он «06- 
наруживает» у себя печень и вводит ее параметры в разряд «контролируемых 
параметров». Контролируемыми параметрами могут быть и ненаблюдаемые 
воздействия. 
Итак, процессы, происходящие в среде, можно подразделить на: 


— воздействующие на организм (ОУ) и не воздействующие на него; 

— воздействия на ОУ в свою очередь можно подразделить на «наблюдае- 
мые» (датчиками ОУ) и «ненаблюдаемые»; 

— воздействия на ОУ, независимо от предыдущего деления, можно разбить 
на два множества — «контролируемых параметров» и «неконтролируе- 
мых параметров». 


Посмотрим теперь, какую же информацию можно и следует передавать 
в УС от датчиков посредством бинарных сигналов. 

Пусть имеется некоторое воздействие у({) среды на ОУ, и нам требуется 
датчик, который мог бы передавать информацию об этом воздействии в УС 
через каждый интервал Аё в дискретном виде — посредством последовательно- 
стей бинарных импульсов. Если наш датчик является сложным устройством, 
имеет внутреннюю память и много выходов, и в каждый «сеанс связи» может 
выдавать целый пакет информации, то его распознающие возможности могут 
быть очень велики. Однако биологические датчики в этом смысле скромны 
и экономны. Каждая рецепторная нервная клетка имеет только один выход. 
Несмотря на то, что реальная рецепторная клетка при возбуждении передает 
в УС целую серию импульсов, попробуем минимизировать ситуацию и сокра- 
тить эту серию до одного импульса. Какую информацию может передать в УС 
один импульс? Один импульс (т. е. сигнал «1»), поступивший в определенный 
момент времени і; от определенного датчика, может нести информацию о том, 
что та ситуация, на распознавание которой был настроен этот датчик, была 
распознана в некоторый момент, предшествующий моменту &. Что именно, 
и как долго распознавал этот датчик ту ситуацию, о которой он передал 
информацию, зависит от того, на распознавание чего именно был настроен 
сам датчик. 

На первый взгляд, казалось бы, что наиболее экономным способом пере- 
дачи информации является способ «дельта-модуляции», при котором передал 
ется только информация о приращении (о 1-й производной) наблюдаемого 
воздействия. Например, пусть сигнал 7+ = 1, поступивший в момент вре- 
мени і; от датчика номер р+, говорит о том, что наблюдаемое этим датчиком 
воздействие у; за фиксированный интервал времени А# увеличилось на вели- 
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чину, не меньшую, чем Лу;. Пусть отрицательные приращения воздействия у; 
фиксируются датчиком р; ‚ передающим сигналы 1; = 1. 

Тогда, суммируя наблюдаемые приращения во времени, мы получим неко- 
торое представление о текущем значении воздействия /;: 


у: (В) = + У 2 (Ду: – Уа (Ди, 


где суммирование ведется по времени от начального момента. 

'Такой способ удобен тем, что датчик передает сигнал только тогда, когда 
наблюдаемая величина изменилась. В остальные моменты времени датчик 
молчит и не загружает каналы связи и УС лишней информацией. Неудобен 
этот способ тем, что при вычислении величины 9;({) суммированием посте- 
пенно накапливается оптибка. Кроме того, следует организовать сам процесс 
суммирования и хранения необходимых данных. Можно предположить, что 
такой способ целесообразно использовать для наблюдения только за некото- 
рыми процессами, когда не требуются большая точность и быстродействие. 
В противном случае следует использовать прямое наблюдение текущего 
значения у; (+) наблюдаемого воздействия. 

Действительно, в биологии известны два типа датчиков — «тонические» 
и <«фазические» рецепторы. Тонические рецепторы передают информацию 
о текущем значении наблюдаемого воздействия, а фазические рецепторы пе- 
редают информацию только об изменении воздействия (что-то вроде инфор- 
мации о 1-й производной). Кроме того, имеются рецепторы, регистрирующие 
только повышение наблюдаемого воздействия, и рецепторы, регистрирующие 
только понижение воздействия. Известно также, что для разных диапазонов 
наблюдаемого воздействия предназначены разные виды рецепторов. Напри- 
мер, у человека имеются кожные терморецепторы нескольких видов, каждый 
из которых регистрирует температуры только в своем определенном диапа- 
зоне. Итак, все органы чувств состоят, в общих чертах, из 


а) некоторой вспомогательной структуры, которая помогает сфокусиро- 

вать и отфильтровать внешнее воздействие, 

б) рецепторной клетки, представляющей собой модифицированный нейрон, 

которая преобразует это воздействие в нервный импульс и 

в) некоторой подсети нейронов (по сути, это уже фрагмент нервной си- 

стемы), произодящих выработку той информации, которая будет пере- 

дана в нервную систему. 
Например, глазное яблоко, диафрагма, хрусталик и другие органы зрения 
являются вспомогательными структурами, отфильтровывающими и направ- 
ляющими световое воздействие среды на палочки и колбочки, являющиеся 
рецепторными клетками, вырабатывающими нервные импульсы, которые об- 
рабатываются трехслойной нервной сетью, устилающей глазное дно и переда- 
ющей сигнал далее в мозг. 

Кроме того, напомним здесь, что обоснованием возможности кодирования 
наличия/отсутствия нервных импульсов сигналами «1» и «0», является тот 
факт, что все нервные импульсы имеют одинаковую форму, длительность 
и амплитуду (рис. 2.5). Отмечая этот факт, биологи говорят, что нервные 
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Рис. 2.5. Нервный импульс и его «модель» — импульсный единичный сигнал 


импульсы подчинены закону «все или ничего», т.е. импульс либо есть, либо 
его нет, не бывает импульсов маленьких или больших, они все одинаковы. 

Ниже мы вернемся к проблеме рецепторов, когда будем описывать их 
моделирование. 

Почему можно ограничиваться только регистрацией самого воздействия 
и его 1-й производной? Во-первых, из теории управления известно, что для 
управления подавляющим большинством динамических процессов этих дан- 
ных достаточно. Во-вторых, производя обработку этих данных, можно вычис- 
лить оценки значений 2-й, 3-й и других производных. Наконец, в-третьих, то, 
что регистрируют биологические рецепторные клетки, нельзя характеризовать 
именно, как 1-ю или какую-то другую производную. Рецептор, по существу, 
представляет собой небольшую распознающую систему, для которой определен 
класс распознаваемых ею объектов (воздействий). Этот класс распознаваемых 
воздействий задается вспомогательной структурой органа чувств и может 
быть определен, в общем случае, произвольным способом. Поясним это на при- 
мере. Фазический волосковый рецептор насекомого реагирует на изгибание 
волоска (вспомогательная структура) внешним воздействием, при этом на- 
правление, скорость и диапазон изгибания должны удовлетворять некото- 
рым условиям. Конечно, такой характер регистрируемого движения ближе 
всего может быть охарактеризован как 1-я производная углового положения 
волоска, однако это лишь приблизительная его характеристика, поскольку 
указанные ограничения могут привносить информацию и о 2-й производной 
и о других особенностях регистрируемого воздействия. 

Математически работу рецептора можно описать с помощью формализма, 
предложенного В. А. Чечкиным [4], согласно которому семантику всякого све- 
дения можно описать следующим способом. 

Источником всякого сведения является некоторый датчик О. Множество 
всех объектов, обладающих свойствами, которые может измерить датчик, 
называется опорным множеством Х. Объект, который подвергся измерению 
датчиком, обозначается семантическим указателем х. Сведение об объекте 2, 
полученное от датчика, может говорить только о том, что объект х принад- 
лежит некоторому подмножеству д опорного множества, Х. Поэтому сведение 
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об объекте х из опорного множества Х, полученное датчиком О, имеющим 
семантическую достоверность р, можно записать с помощью выражения 


(р)б(х), гле СХ, тЕб хЕХ. 


Например, для сведения «карандаш, который Вы мне дали, имеет длину 
15 см» датчиком могла служить линейка с заданной достоверностью р. Опор- 
ным множеством Х является множество всех объектов, которые можно из- 
мерить данной линейкой. Подмножество д здесь представляет все предметы 
из множества Х, имеющие длину 15 см, а семантический указатель указы- 
вает на тот предмет, к которому относится данное сведение, это «карандаш, 
который Вы мне дали». 

Сведения могут быть сравнимыми на общность. Так, если 91 С 02, то 
62 называется более общим сведением, а бу — менее общим сведением об 
объекте =. 

Применяя этот формализм к органам чувств и пытаясь формализовать 
сведение, приносимое сигналом «1» от некоторого датчика (рецептора) 2;, 
получаем, что опорное множество Х; определяется вспомогательной струк- 
турой органа чувств, тем классом явлений, которые она может отобразить 
на рецепторную нервную клетку. Например, это звук определенной полосы 
частотного спектра, определенного диапазона силы и определенного диапазона, 
продолжительности. 

Именно опорное множество определяет, 1-ю ли или 2-ю производную реги- 
стрирует данный датчик, либо еще что-то. Опорное множество можно опреде- 
лить как класс объектов, заданный определенными границами или правилами 
в пространстве признаков. Возьмем два признака: Р (сила некоторого воздей- 
ствия) и # (время) и нарисуем пространство признаков (Р; 1) (рис. 2.6). В этом 
пространстве зададим множество некоторых кривых, которые не должны 
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Рис. 2.6. Условный пример того, как вспомогательная структура органа чувств 

может определять в пространстве признаков произвольную границу для распознавае- 

мого класса 1 сигналов. В данном случае рецептор будет реагировать на увеличение 
воздействия Р с отрицательной 2-й производной 
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выходить за границы, соответствующие области 91. Если кривая не выходит 
за заданные границы, то будем говорить, что она принадлежит классу О}, 
если выходит, то — классу (0. Пусть вспомогательная структура некоего 
органа чувств отделяет только кривые из класса (0, другими словами — 
она распознает только такое изменение признака Р во времени, которое 
описывается заданными границами класса 91. Если наблюдаемое воздействие 
принадлежит классу 0}, то рецептор выдаст сигнал «1», если же оно при- 
надлежит классу 95, то данный рецептор выдаст сигнал «0». Понятно, что 
вспомогательная структура органа чувств может задавать такую конфигура- 
цию области 9 в пространстве признаков, которая будет соответствовать 0-й, 
1-й, 2-й и другим производным или удовлетворять иным правилам. В данном 
случае опорное множество Х датчика совпадает с подмножеством д сведения, 
которое может передавать датчик, поскольку датчик может выдать только 
два показания: «1» или «0» («да — совпадает с тем, что я умею распознавать» 
или «нет — не совпадает»). Семантический указатель 1 сведения, приносимого 
рецептором Р;, связан с «номером» 7 самого рецептора, жестко закреплен- 
ного на теле организма и тем самым имеющего определенное фиксированное 
«поле зрения». 

Наконец, с помощью имеющей несколько слоев нейронной сети, непосред- 
ственно примыкающей к рецепторным клеткам и обычно вынесенной в сам ор- 
ган чувств, можно еще более усложнить те требования к характеристикам воз- 
действий, которые могут распознаваться органом чувств. Так, например, глаз 
лягушки распознает только движущиеся предметы и не распознает неподвиж- 
ных. А глаз человека неподвижные предметы распознает и особенно сильно 
реагирует на прямые линии. Можно с большой уверенностью предполагать, 
что эти свойства глаза определяются не палочками и колбочками, а именно 
примыкающими к ним нейронными структурами. Именно рецептивные поля 
ганглиозных клеток и характерная топология их структур, объединяющих оп- 
и ой-клетки, позволяют глазу человека распознавать образы отрезков прямых 
линий, наклоненных под различными углами [5]. 

К высказанным общим положениям, касающимся датчиков, необходимо 
добавить, что оптимальные для данного организма их характеристики — 
состав датчиков, их расположение, вспомогательные структуры, параметры 
рецепторных нервных клеток и примыкающих к ним нейронных структур 
должны быть определены еще до рождения организма. Будем предполагать, 
что этим оптимизирующим «инженером» является эволюционный отбор, од- 
нако у нас нет полной уверенности, что это именно так. 


2.6. Исполнительные органы 


Теперь рассмотрим те общие положения, которые касаются выходных воз- 
действий нервной системы. «Выходными полюсами» нервной системы будем 
считать окончания аксонов эффекторных (моторных) нейронов, по которым 
от нервной системы поступают вовне нервные импульсы. Эти эффекторные 
нервные импульсы активируют «исполнительные устройства» организма, ко- 
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торые в свою очередь воздействуют на внешнюю и внутреннюю среду. Ис- 
полнительными органами являются либо мышцы, либо секреторные органы. 
Воздействие нервного импульса на мышцу вызывает сокращение, либо рас- 
слабление последней. Управляя сокращением и расслаблением групп мышц, 
можно приводить в необходимое движение определенные части тела организма, 
(лапы, бивни, зубы, легкие, голосовые связки). Активация секреторных орга- 
нов приводит к выделению в среду некоторых секретов, либо к прекращению 
такого выделения. По сути дела и мышечные и секреторные исполнитель- 
ные органы активируются медиаторами, которые выделяются из пресинап- 
тической мембраны эффекторного нервного волокна. Поэтому все выходные 
воздействия УС можно полагать унифицированными — это есть стандартные 
нервные импульсы, приводящие к выбросу медиатора в нервных окончаниях 
(возможно, что существуют и иные воздействия организма на среду, но мы 
не располагаем знаниями об этих явлениях и не будем их здесь рассма- 
тривать). 

Итак, на выходных полюсах УС в разные моменты времени появляются 
и исчезают нервные импульсы, которые отражают «принимаемые управляю- 
щей системой решения». Эти нервные импульсы поступают на исполнительные 
органы (ИО) организма, активизируют их работу, и они, в свою очередь уже 
воздействуют на среду (рис. 2.7). 


2.7. Целевые функции управления 


Проследим теперь судьбу воздействий, которые организм оказывает на среду 
(рис. 2.7), и происхождение воздействий на организм со стороны среды 
(рис. 2.4). Часть выходных воздействий организма вызывает такие последо- 
вательности процессов в среде, которые в какой-то форме вызовут ответные 


Рис. 2.7. Управляющие команды нервной системы через выходные полюса (малень- 
кие треугольники) поступают на исполнительные органы (большие треугольники), 
которые и реализуют физические воздействия на среду (пунктирные линии) 
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Рис. 2.8. Петли обратных связей через среду, которые должна найти 
управляющая система, чтобы управлять и выжить 


воздействия среды на организм. Другими словами, часть выходных воздей- 
ствий объекта управления (ОУ), пройдя через среду, вернется к ОУ. Другая 
часть выходных воздействий ОУ никогда не вернется к ОУ в виде реакций 
среды (рис. 2.8). В свою очередь, воздействия на организм со стороны среды 
подразделяются на два множества — воздействия, которые были спровоци- 
рованы самим организмом, и воздействия, которые были порождены в среде 
независимо от действий организма. Назовем «стоком» то гипотетическое ме- 
сто в среде, в котором безвозвратно исчезают воздействия ОУ. А то место 
в среде, в котором без видимых для ОУ причин неожиданно появляются 
воздействия — «истоком». Отметим также, что среди всех команд, имеющихся 
в распоряжении управляющей системы (УС), есть такие, которые вызывают 
воздействия ОУ, бесполезно уходящие в сток. 

Выскажем теперь идею (подсказанную однажды В. Ф. Левченко), что ор- 
ганизм сможет выжить в незнакомой ему среде только в том случае, если 
ему удастся найти такие воздействия на среду, которые вернутся с реакциями 
среды к его датчикам. Если организм не найдет таких обратных связей, то 
он не сможет управлять собой и погибнет. Развитие этой идеи и послужило 
поводом к появлению данной книги. 

Итак, для того чтобы организм (ОУ) смог выжить в неизвестной ему 
среде (удовлетворить первой целевой функции), его нервной системе (УС) 
необходимо: 


— среди всего множества действий управляющей системы найти такие, 
которые возвращаются к УС в виде закономерных реакций — обратных 
связей (пройдя путь через исполнители, среду и датчики), 
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— оценить, насколько полезны или вредны для выживания ОУ каждая 
из этих найденных обратных связей (оценки качества этих обратных 
связей), 

— запомнить информацию об этих обратных связях и их оценках качества 
в своей памяти как знания, отражающие свойства системы, 

— в каждый текущий момент находить в своей памяти те действия, кото- 
рые обещают (согласно накопленным в памяти знаниям) дать наиболее 
полезные в распознаваемой текущей ситуации реакции среды, и давать 
команду на совершение этих действий, 

— стремиться к накоплению знаний в своей памяти, потому что чем больше 
знаний накопит УС, тем с большей вероятностью она сможет обеспечить 
выживание ОУ, самое себя и сохранность своих знаний. 


Все эти задачи можно объединить в одной: нервная система должна стре- 
миться к добыванию и накоплению знаний о свойствах системы «среда — ОУ — 
УС». Это вторая целевая функция нервной системы. Таким образом, здесь мы 
можем сформулировать две основные цели, к достижению которых должна 
стремиться нервная система всякого организма. 


Главными целями, к которым стремится нервная система всякого организма, 
являются: 


® выживание организма; 
ө накопление знаний его нервной системой. 


Если мы говорим, что моделью организма является автономный ОУ, а мо- 
делью его нервной системы является его бортовая УС, то главными целевыми 
функциями управления УС автономного ОУ также должны являться: 


® выживание ОУ; 
® накопление знаний о свойствах системы «среда — ОУ — УС». 


Мы не упорядочили эти целевые функции по важности, потому что 
не знаем, которая из них является более важной. Эти целевые функции взаимо- 
обусловленны. Пусть, например, мы хотим сделать робот, который должен как 
можно дольше выжить в среде с неизвестными заранее свойствами. Тогда он 
будет должен одновременно стемиться к накоплению знаний, чтобы повысить 
вероятность выживания, делая свое поведение все более адекватным свойствам 
среды. Если же мы хотим сделать робот, предназначенный для того, чтобы 
накопить как можно больше знаний о среде, в которую его послали, то он 
должен стремиться и к выживанию, чтобы иметь возможность сохранять 
и приумножать накопленные знания. 

Определяя именно эти целевые функции как главные для всех организмов 
а, тем самым, и для их искусственных моделей, мы несколько расходимся 
как с традиционным положением о системах управления, так и с теорией 
биологических систем управления. В традиционном положении управляющей 
системе всегда задается какая-либо конкретная целевая функция, например — 
удерживать такие-то параметры в таких-то заданных границах. А в теории 
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биологических систем управления утверждается, что организм всегда стре- 
мится к удовлетворению определенных «потребностей», например, потребно- 
стей в пише, в размножении, в поддержании гомеостаза. 

Говоря о биологических системах, мы полагаем, что указанные нами це- 
левые функции — выживание и накопление знаний — являются более 
общими, чем стремление к удовлетворению потребностей в пище, размноже- 
нии и т. д., которые есть лишь их конкретизация или средство к выживанию 
и к накоплению знаний. К обсуждению этого вопроса, мы вернемся ниже, после 
рассмотрения некоторых других необходимых понятий. 

Говоря об искусственных управляющих системах, мы должны признать, 
что если мы не заложим стремление к выживанию и к накоплению знаний 
в качестве главных целевых функций в искусственную модель организма или 
его нервной системы, то ее поведение будет противоестественно. Например, 
пусть мы создали прекрасную модель кошки и заставили ее выполнять нуж- 
ную нам работу, стремиться к нужной нам цели, скажем — подметать крышу 
дома. Очевидно, что «лучшая модель кошки — это сама кошка». Если мы 
будем заставлять ее делать работу для нас, то, скорее всего, что она придет 
в негодование и откажется ее делать, именно потому что мы нарушим ее 
естественное право — стремление к ее собственным целевым функциям. Кошка 
хочет выживать, поэтому она хочет в нужное ей время есть, спать, отдыхать, 
общаться с другими кошками, искать травку, нужную ей для лечения. Кошка 
хочет накапливать знания, поэтому она хочет играть, гулять, исследовать 
окружающее пространство. Нам придется очень постараться, чтобы заставить 
такую кошку удерживать какие-то ненужные ей параметры в указанных 
ей рамках. Как минимум, нам придется сделать так, чтобы этот параметр 
был нужен роботу-кошке для выживания. Мы хотим подчеркнуть, что если 
в управляющей системе не заложены целевые функции выживания и накоп- 
ления знаний, то эта управляющая система не может претендовать на роль 
модели нервной системы, даже если при этом она прекрасно решает какие-то 
интеллектуальные задачи, типа игры в шахматы или распознавания образов. 


2.8. Макроописание системы 


Мы хотим подойти к пониманию внутренней структуры управляющей си- 
стемы (УС) и определить задачи, которые, исходя из заданных условий и це- 
левых функций, вынужденно должна решать нервная система организма. Мы 
хотим также осознать трудности, с которыми связано решение этих задам. 
Для этого необходимо дать более точное и формализованное описание системы 
«среда — ОУ — УС». 

Прежде всего, уточним общее представление о системе, отраженное 
на рис. 2.8. Очевидно, что «стоки» и «истоки» воздействий находятся 
не только в среде, но и в теле объекта управления (ОУ) и в самой УС. 

«Стоки» в ОУ — это то, что является причиной затухания, диссипации, 
поглощения, прерывания и исчезновения интересующих нас процессов в теле 
организма. Например, пусть нашего тела достиг некоторый звук, но система 
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слуха не смогла доставить информацию о нем к нашей нервной системе: 
может быть, звук был слабым, может быть, слух у человека был понижен. 
Еще пример: нервная система дала команду некоторой мышце сократиться, 
но мышца по какой-либо причине не выполнила эту команду. И в том, и в 
другом случае будем говорить, что воздействие ушло в сток и не достигло 
своего приемника. 

«Истоками» в ОУ являются причины, побуждающие исполнительные ор- 
ганы совершать воздействия на среду без команды со стороны нервной си- 
стемы. Это могут быть, например, непроизвольные сокращения мышц. Сюда 
же отнесем причины самопроизвольно возникающих в датчиках ложных сиг- 
налов, поступающих на вход нервной системы. 

К «стокам» в УС отнесем явления затухания процессов нервного возбужде- 
ния, которые, наверняка имеют место в нервной системе. Например, нервная 
система восприняла входную информацию от рецепторов, но порожденный 
этим процесс вскоре затух в нервной системе, не вызвав никакой внешней 
реакции. Либо нервная система, сгенерировала начало нового процесса, но тот 
вскоре прекратился, не выходя за пределы нервной системы (обе ситуации 
проницательный Гончаров усмотрел и показал нам в поведении славного Ильи 
Ильича Обломова). 

К «истокам» УС отнесем те места, где нервные процессы могут порож- 
даться, не будучи инициированы другими нервными процессами. 

Здесь необходимо также обратить внимание на то, что представление 
некоторой системы в виде графа из дискретных элементов со своими сто- 
ками и истоками, происходит тогда, когда мы в силу каких-либо причин 
ограничиваемся в своем рассмотрении системы только некоторым ее срезом, 
оставляя за кадром те ее элементы, которых мы не хотим рассматривать, либо 
не знаем. Например, мы можем рассмотреть компьютер только с точки зрения 
электрических сигналов. Получим граф — электрическую схему, в которой 
истоками будут источники питания, устройства ввода информации — клавиа- 
тура, магнитные диски, и другие устройства, преобразующие какие-то внеш- 
ние воздействия в электрические сигналы. С точки зрения логики компьютера 
мы не сможем понять закон, по которому, например, человек нажимает на ту 
или иную клавишу, либо почему с диска вводится этот конкретный символ. 
Но те электрические сигналы, которые уже попали в наблюдаемый нами 
«срез» электрической схемы, будут вызывать логически детерминированные 
процессы. Этот же компьютер мы можем рассмотреть в «срезе», например, ме- 
ханических устройств — тогда получим граф со своими уже другими стоками 
и истоками. Отсюда сделаем вывод, что если некоторый элемент нашей схемы 
выдает свои выходные воздействия случайным для нас образом, значит, мы 
не видим каких-то входов этого элемента, имеющих иную природу. 

Мы можем предположить, что нервная система содержит свои истоки 
нервных импульсов (например, известно, что существуют так называемые 
«унарные» нейроны, не имеющие входов, а имеющие только выход). Эти 
импульсы с точки зрения нервной системы будут восприниматься как слу- 
чайные. Более того, как будет показано ниже, в нервной системе, осуществля- 
ющей поисковое поведение, обязательно должны быть источники случайных 
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Рис. 2.9. Изображение системы «среда — ОУ — УС», в которой показаны истоки 
(белые кружки), стоки (черные кружки) и все возможные в системе маршруты 
распространения воздействий 


нервных воздействий, которые и обеспечивают случайный поиск. И, соот- 
ветственно, можно предположить, что эти случайные воздействия являются 
«случайными» только с точки зрения нервной системы, а на самом деле они 
не случайны и управляются некоторыми другими, не нервными процессами. 
Если бы кто-то мог управлять такими процессами, то он тем самым задавал 
бы фактически направленный случайный поиск. 

Итак, с учетом всех трех истоков и всех трех стоков мы получаем схему, 
описывающую порождение, распространение и прекращение всех процессов 
в системе «среда — ОУ — УС» (рис. 2.9). Под процессом здесь для большей 
четкости будем понимать сеть из направленных инцидентных маршрутов, 
начинающихся в одном из истоков, разветвляющихся, сливающихся и зал 
канчивающихся в стоках. Для более удобного объяснения пометим буквами 
все маршруты, составляющие процессы. Понятно, что за каждой стрелкой 
стоит множество фрагментов различных процессов, у которых общие локали- 
зации начала и окончания. Если некоторый маршрут расщепляется, то будем 
относить это к точке начала маршрута. Всякий процесс может начинаться 
только в одном из истоков и может заканчиваться только в одном из стоков, 
проходя через последовательно связанные маршруты, в том числе образуя 
циклы. Фактически этим мы показали всю систему петель обратных связей, 
существующих в системе. 

Этот рисунок удобен тем, что он систематизирует все процессы в системе 
и позволяет перейти к их планомерному рассмотрению и моделированию. 

Поясним содержательно некоторые из процессов на примерах. Пусть в ис- 
токе среды порожден некоторый процесс (маршрут 5), который воздействовал 
на ОУ. Часть (К) этого воздействия не была воспринята датчиками и ушла 
в сток ОУ. Часть (1) воздействия была воспринята датчиками, и информация 
об этом была передана в УС. Некоторая часть (|) информации, поступившей 
в УС, не была ею воспринята и ушла в сток УС. Однако часть входной 
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информации была обработана УС (а) и передана на выход УС в качестве 
управляющего решения УС. При этом к этой выходной информации была 
добавлена случайная информация (т), порожденная истоком УС. Некоторая 
составляющая (о) выходной команды УС не была реализована исполнителем 
и ушла в сток ОУ. Другая часть (Б) команды активировала исполнитель, 
который передал информацию через датчики снова на вход УС, не выходя 
в среду. УС еще раз обработала эту информацию (а) и передала ее испол- 
нителям (1), которые воздействовали на среду. Воздействие исполнителей 
породило в среде процесс (9), результат которого был воспринят датчиками, 
передавшими информацию (1) в УС, которая «осмыслила» его (маршруты а, 
Б), после чего процесс завершился (1) в стоке УС. 

Еще пример. Предположим, что побуждение к накоплению новых знаний 
производится истоком УС. Пусть этот исток породил процесс (т), и он вызвал 
работу исполнителя (в), пробное воздействие которого на среду ушло в сток 
среды по маршруту (+), т.е. полезных для управления знаний УС не приобрела. 

Можно придумать большое множество примеров, соответствующих типич- 
ным и нетипичным ситуациям в системе «среда — ОУ — УС». 

Схема на рис. 2.9 позволяет сделать общие выводы, которые запишем 
в следующих положениях. 


Положение об объекте управления. Схема системы «среда — ОУ — УС» 
позволяет увидеть, что управляющее влияние управляющей системы состоит 
в воздействии на процессы, в том числе циклические, проходящие через УС, 
либо начинающиеся в УС. Поскольку эти процессы представляют собой сеть 
маршрутов, проходящих через всю систему «среда — ОУ — УС», в том числе 
и через саму УС, то отсюда следует, что истинным объектом управления 
для УС является не тот объект, который мы до сих пор называли ОУ, а вся 
система «среда — ОУ — УС». На содержательном примере это выглядит, 
например, так: для мозга кошки объектом управления является весь мир, 
частью которого является и сама эта кошка. В сущности, это правильно, 
если под управлением, осуществляемым некоторым субъектом над некоторым 
объектом, понимать процесс достижения субъектом поставленной им цели 
посредством манипулирования объектом на основе знания его свойств. На этом 
примере видно, что, управляя процессом ловли мыши, принимая управляющие 
решения и выполняя их, кошка учитывает, как будут вести себя в ответ на ее 
действия: исполнительные и другие органы ее собственного тела, окружающая 
среда — предметы, хозяйка, освещение от солнца или луны, мышь, ее собствен- 
ные кошачьи датчики в случае того или иного развития событий, реакции 
ее собственной нервной системы в последующих возможных ситуациях (здесь 
управляющей системой планируется возможная дальнейшая реакция самой 
управляющей системы), следующие ходы мыши, других объектов среды и т. д. 
Можно смело утверждать, что мозг кошки управляет миром в том отношении, 
в каком она может это делать. Это можно сказать о всяком живом организме. 

Еще пример: мозг, управляющий телом человека, начинает управлять и те- 
лом, и автомобилем, когда этот человек садится за руль автомобиля. Если этот 
человек оказался капитаном, и он поднимается на мостик корабля, то этот 
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же самый мозг начинает управлять кораблем. А если этот капитан оказался 
командиром эскадры кораблей, то этот же мозг начинает управлять эскадрой 
или всем театром военных действий. Другими словами, объектом управления 
в рассматриваемых нами системах является не собственно ОУ как объект, 
являющийся носителем УС, а именно система «среда — ОУ — УС». Если 
изменить свойства любой из составляющих системы, то ее свойства тоже из- 
менятся. Погрузим космический аппарат в иную среду, не в вакуум, а в песок, 
и его двигатели уже не смогут поддерживать нужную ориентацию аппарата. 
Изменим исполнительные устройства или датчики ОУ, и управление тотчас 
нарушится. Наконец, изменим УС, которая станет по-иному управлять ОУ, 
и реакция среды может оказаться совсем иной (так изменяется отношение 
внешнего мира к предприятию при смене его директора). 

Итак, для рассматриваемых нами управляющих систем в сущности 
не важно, где проходит граница между ОУ и средой, не важно, что именно 
в окружающей УС среде играет роль датчиков, исполнителей, собственно ОУ 
и среды. От этих объектов управляющей системе требуется только, чтобы 
они обеспечивали прохождение информации по маршрутам, замыкающим 
обратную связь между выходами и входами УС через пространство, лежащее 
вне УС. Сами эти внешние для УС объекты — датчики, исполнители, другие 
элементы ОУ и окружающая среда сливаются в один объект, который 
иногда мы для удобства будем называть просто средой. Наличие датчиков 
и исполнителей в этом макрообъекте- «среде» только «предполагается» 
управляющей системой в том смысле, что у этого объекта должны быть 
некая афферентная (воспринимающая команды УС) и эфферентная (реа- 
гирующая) части. Кроме того, с точки зрения УС датчики и исполнители 
играют роль интерфейса, согласующего разнородные сигналы и процессы 
«среды» с дискретной бинарной формой сигналов, действующих в УС. 
И наконец, из соображений о необходимой начальной приспособленности ОУ, 
которая будет рассмотрена ниже, требуется, чтобы датчики обеспечивали 
«наблюдаемость и управляемость» системы. Тем самым, мы можем говорить, 
что в рассматриваемых нами системах объекты управления (организмы) 
состоят только из датчиков, исполнительных органов и управляющих систем. 
Все остальные органы в теле любого организма относятся только к этим 
подсистемам и служат для поддержания их функций. 

Итак, на основании сказанного будем полагать, что УС управляет не объ- 
ектом управления ОУ, а всей системой «среда — ОУ — УС», и устройство УС 
(нервных систем) в своих общих чертах должно быть независимым от содер- 
жания ОУ и среды, т.е. должно быть в определенном смысле универсальным. 
Действительно, общие черты мы можем видеть в нервных системах всех 
живых организмов (о причинах их различий поговорим позже). 

В подтверждение наших положений укажем также на работу Дж. Ик- 
скюля [6], который полагал, что поведение должно быть рассмотрено не как 
линейная последовательность событий, начинающаяся с возбуждения рецеп- 
торов, а как функциональное кольцо. Дж. Гибсон [7| считал, что среда и ор- 
ганизм не являются отдельностями, но образуют функциональное единство, 
к анализу которого принцип «стимул-реакция» не может быть применен. 
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Положение о полносвязности системы. Из общих представлений о свой- 
ствах окружающей нас естественной среды следует, что любая система в ней 
является полносвязной, где каждый элемент влияет на каждый. Если система 
представляется не полносвязной, то это говорит только об ограниченности 
нашего понимания или ограниченности принятого нами описания такой си- 
стемы. В живых организмах взаимовлияние всех подсистем вообще весьма 
сильно и разнопланово. Например, когда мы рассматриваем нервную сеть, 
где осуществляется направленная передача сигналов, следует помнить, что 
существуют иные способы передачи информации, такие как химические ме- 
диаторы, выделяемые нейронами, кроветок, другие физиологические среды, 
возможно — поля. Более того, на наш взгляд, следует полагать, что формиро- 
вание в живых организмах нервных клеток, специализирующихся на однона- 
правленной передаче сигналов, есть попытка живого организма преодолеть эту 
полносвязность своих подсистем, упорядочить информацию о происходящих 
в них процессах, без чего было бы невозможно управление. Без упорядоченной 
во времени и пространстве передачи сигналов невозможно уловить и использо- 
вать причинно-следственные отношения событий в системе. Сделанный нами 
рис. 2.9 и показывает упорядоченную, направленную передачу информации 
в системе, отражающую причинно-следственные отношения событий в эле- 
ментах системы и необходимую для управления. 


Положение о множественности процессов. В рассматриваемой системе 
на множестве направленных маршрутов передачи информации может разви- 
ваться очень много видов процессов, особенно с учетом циклов. Действительно, 
инициатором процессов могут быть среда, тело организма или нервная си- 
стема. Каждый процесс может иметь много циклов, разветвлений, слияний 
и заканчиваться в различных стоках. 


Положение о помехах и потерях информации. Наличие истоков и сто- 
ков, разветвлений и слияний процессов в системе вносит помехи и приводит 
к потере информации. Существует много возможностей для влияний со сто- 
роны среды, тела организма или нервной системы на всякий процесс, идущий 
в системе. Из практики мы знаем, что в естественных условиях практически 
невозможно один и тот же опыт повторить дважды абсолютно одинаково, 
и необходимы специальные, осуществимые только в лабораторных условиях 
усилия, чтобы избежать нежелательных воздействий. Однако жизнь реальных 
организмов происходит не в лабораторных условиях, и, по-видимому, то, что 
мы обычно воспринимаем как помехи, на самом деле несет развивающимся 
и адаптирующимся нервным системам организмов полезную информацию, 
позволяя им улавливать все большее количество связей в окружающем мире. 

Поскольку мы сейчас рассматриваем основную идею адаптивного управ- 
ления, то первоочередной интерес для нас представляет (см. рис. 2.9) 


основной цикл 
‚(9 = (0) — (а) = (Һ) = (9) –..., 


который мы назовем циклом управляемого взаимодействия (УВ). Это тот 
основной цикл, который УС должна найти, чтобы установить управление 
в системе «среда — ОУ — УС». Еще более интересны процессы, в которые 
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включен цикл 


. (а) > (5) ..., 


но к этому гораздо более сложному в реализации процессу мы вернемся позже. 
Итак, для того чтобы найти цикл УВ, управляющей системе необходимо 
найти закономерные связи между: 


— состояниями системы, которые наблюдаются посредством датчиков (это 
состояния-условия, или «исходные» состояния), 

— действиями, которые УС предпринимала в этих условиях, и которые 
были выполнены исполнителями, о чем информация может быть полу- 
чена посредством специализированных датчиков, установленных на ис- 
полнителях, 

— состояниями, в которые перешла система в результате совершения дей- 
ствий. 


Эти задачи следует решить в условиях многообразия процессов и наличия 
помех и утечек информации. Названные здесь три задачи являются опре- 
деляющими для управляющей системы, и им будет уделено ниже большое 
внимание. 

Полезной для макроописания системы может оказаться также рекомпо- 
зиция системы, при которой в объекте управления, помимо управляющей 
системы, отдельно выделяются блок датчиков (БД) и исполнительные ор- 
ганы (ИО), что может оказаться существенным для понимания и моделирова- 
ния системы (рис. 2.10). 

Рис. 2.10 полезен тем, что позволяет увидеть следующие свойства системы. 


Симметричность системы. Действительно, пусть УС есть интеллекту- 
альная адаптивная система управления, которая пытается установить цикл 
управляемого взаимодействия (УВ) в системе, получая информацию от БД 
и выдавая свои решения на ИО. Если мы захотим сделать блок датчиков 
интеллектуальным и адаптивным, то надо поместить УС в БД и вся картинка 


ио среда 


УС БД 


Рис. 2.10. Рекомпозиция системы «среда — ОУ — УС», в которой ОУ с точки зрения 

управляющей системы представлен только блоком датчиков (БД), исполнительными 

органами (ИО) и средой. Цикл управляемого взаимодействия показан жирными 
стрелками 
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просто повернется против часовой стрелки. Если мы предположим, что в среде 
есть некоторая интеллектуальная УС, то картинку следует повернуть еще раз. 
Аналогичная ситуация получится при попытке сделать интеллектуальными 
исполнительные органы — еще один поворот картинки. 


Связность всех подсистем. На рис. 2.10 хорошо видны все возможные 
связи между элементами системы. Очевидно, что цикл УВ представлен только 
частью этих связей. Например, УС может получать информацию непосред- 
ственно из среды, минуя датчики, и передавать информацию непосредственно 
в среду, минуя исполнители. Это «нештатные» каналы передачи информации, 
но они существуют всегда. 

В заключение предложенного макроописания системы «среда — ОУ — УС» 
сравним его с общепринятым подходом к построению систем управления. 
Обычно при описании систем управления общее описание системы дается 
в следующем виде (рис. 2.11). 

Здесь объект управления (ОУ) рассматривается отдельно от системы 
управления (СУ), блока датчиков (БД), системы распознавания (СР) и ис- 
полнительных устройств (ИО). Например, объект управления — это ракета. 
Задается некоторая целевая функция — например, траектория полета. Блок 
датчиков и система распознавания определяют действительное положение 
объекта управления, после чего производится вычисление текущего рассогла- 
сования заданной и действительной траекторий. Значение рассогласования 
передается в систему управления, которая по некоторому детерминирован- 
ному или настраиваемому закону управления находит значение управляющего 
воздействия, должного минимизировать текущее рассогласование — вернуть 
ракету на заданную траекторию. Найденное системой управления решение 
передается исполнительным устройствам, которые воздействуют на объект 
управления и тем самым возвращают его к заданной траектории. Закон 
управления, записанный в памяти такой системы управления, рассчитывается 
заранее посредством обратного решения систем уравнения, описывающих ди- 
намику поведения объекта управления. Уравнения, описывающие движение 
объекта управления, обычно представляют собой систему дифференциальных 
уравнений, возможно — нелинейных, которые в аналитической форме связы- 
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возмущающие 


воздействия 
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Рис. 2.11. Общепринятое представление системы 
«среда — объект управления — система управления» 
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вают движение объекта управления во времени и пространстве в зависимости 
от воздействий исполнительных устройств и возмущающих воздействий со 
стороны среды. Такую систему уравнений обычно называют математической 
моделью объекта управления. 

Разработка математических моделей объектов опирается на знания содер- 
жательной стороны моделируемой системы и на возможности математики. 
Напомним, что современная математика является системой специфических 
образов, выработанных некоторыми людьми-математиками для формального 
описания некоторых явлений и управления ими. Точность математических 
моделей в общем случае ограничивается следующими факторами: 

1. Возможностями математики, сложностью и разнообразием тех свойств 
реальных объектов, которые могут быть описаны математически, ограничен- 
ными текущим достигнутым уровнем математических знаний. 

2. Точностью конечных результатов математического моделирования, ко- 
торая ограничивается возможностями практического решения тех систем 
уравнений, которые составляют математическую модель. Известно, что прак- 
тические численные значения могут быть вычислены отнюдь не для всех 
тех моделей, которые можно записать в аналитической форме. Очень часто 
практические решения в таких моделях удается получить только с помощью 
приблизительных численных методов, ограниченных в свою очередь быстро- 
действием и точностью используемых вычислительных устройств. 

3. Использованием в математических моделях коэффициентов, численные 
значения которых измеряются в предварительных экспериментах на физи- 
ческих моделях объектов или вычисляются на основе предварительных экс- 
периментов. От точности таких коэффициентов во многом зависит точность 
всей модели. Однако часто значения некоторых коэффициентов не могут быть 
измерены точно по различным причинам. 

4. Изменчивостью свойств объектов управления. В реальности свойства 
объектов управления часто являются нестационарными, они могут с той или 
иной скоростью изменяться уже в процессе работы системы управления. Изме- 
нения свойств могут происходить по разным причинам, например, вследствие 
изменения свойств материалов, из которых изготовлен объект управления, 
изменения свойств составляющих его подсистем, изменения свойств окружаю- 
щей среды, перемещения объекта управления в иные области пространства- 
времени, и по многим другим причинам. При разработке математических 
моделей объектов управления стремятся предусмотреть возможные изменения 
свойств объектов и учесть их, например, приспосабливая объект управления 
к усредненным значениям изменяющихся параметров, либо предусматривая 
различные варианты модели для различных вариантов значений изменяю- 
щихся параметров. Однако далеко не всегда можно предусмотреть, что именно 
и каким образом будет изменяться в процессе работы сложной системы. Осо- 
бенно плохо поддаются прогнозированию системы, в состав которых включены 
элементы естественной природы. 

Сравнивая макроописание системы в рассматриваемом подходе 
(см. рис. 2.9 и 2.10) с традиционным макроописанием системы (рис. 2.11), 
можно видеть следующие различия. 
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Система ААУ как модель 
естественной управляемой системы 


УС изначально рассматривается как 
«бортовая» или «автономная» система, 
которая является подсистемой ОУ. 


Поскольку УС автономна — является ча- 
стью ОУ, развивающегося и проживаю- 
щего свою жизнь в реальном времени, 
то обучение и управление УС должны 
происходить в одном процессе. При этом 
знания УС должна приобретать само- 
стоятельно и «штатным» путем через 
свои датчики и исполнители в процессе 
развития и жизни организма — ОУ. 
Некоторые начальные знания переда- 
ются наследственным путем. 


Основная задача организма как ОУ — 
приспособиться к обстоятельствам и вы- 
жить. Поэтому главные целевые функ- 
ции УС универсальны — это а) выжива- 
ние и б) накопление знаний. 


Поскольку и ОУ-организм и среда раз- 
виваются и изменяются во времени, то 
и знания должны изменяться — накап- 
ливаться, уточняться. Управление адап- 
тивно по необходимости. 


Объект управления — тело организма, 
понимается как часть среды. Следова- 
тельно, с точки зрения управляющей си- 
стемы среда вовлечена в цикл управ- 
ляемого взаимодействия. Тем самым, 
в определенном смысле для управля- 
ющей системы стирается грань между 
собственно объектом управления и сре- 
дой, поскольку УС управляет системой 
«среда — ОУ — УС». 

Предусмотрены и определены не один, 
но многие контуры управления, как 
маршруты в системе, по которым могут 
проходить воздействия и информация. 
Например, прямые связи между датчи- 
ками и исполнителями, между средой 
и управляющей системой, минуя дат- 
чики и т. д. 
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Традиционный подход к управлению, 
используемый в современной технике 


Система управления может быть от- 
делена от ОУ, находиться, например, 
в удаленном Центре Управления и свя- 
зываться с ОУ, скажем, по телеметрии. 


Возможно и обычно используется пред- 
варительное обучение системы управле- 
ния. Знания могут быть вложены в па- 
мять системы управления сразу при ее 
конструировании, добавляться и изме- 
няться в процессе управления. Объем 
и содержание знаний неограничены, так 
как используется неавтономный источ- 
ник знаний — УС, находящаяся вне ОУ. 


Задачи объектов управления определя- 
ются их создателями, они могут быть 
самыми разными. Соответственно, целе- 
вые функции определены назначением 
конкретной прикладной системы. 


Если известно, что объект управления 
не будет изменяться со временем, то 
не требуется и изменения знаний. 


Объект управления понимается очень 
конкретно, он описывается значениями 
своих параметров в некотором призна- 
ковом пространстве, и задача управле- 
ния — удержать значения параметров 
в пределах, заданных целевой функ- 
цией. Среда рассматривается как источ- 
ник внешних возмущений. 


Контур управления определяют макси- 
мально строго и однозначно. 


2.9. Условие наибольшей начальной неопределенности знаний 


Система ААУ как модель 
естественной управляемой системы 


Все воздействия среды и других объек- 
тов, не соответствующие текущим зна- 
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Традиционный подход к управлению, 
используемый в современной технике 


Обычно четко определяется — что есть 
полезный сигнал, а что есть помеха. 


ниям УС, рассматриваются не как по- 
меха и возмущения, но как еще не из- 
вестные УС закономерности, которые 
следует понять и интегрировать в струк- 


туру знаний. 


Можно и далее продолжать перечисление различий, которые видны при 
сравнении макроописаний этих подходов. Чтобы яснее себе их представить, 
полезно мысленно провести сравнительный анализ какого-либо живого орга- 
низма (например, кошки) с искусственным управляемым объектом (например, 
ракетой). 


2.9. Условие наибольшей начальной 
неопределенности знаний 


Продолжим описание очевидных условий, которым должна удовлетворять 
УС как модель нервной системы. Следующим является условие наибольшей 
начальной неопределенности знаний управляющей системы. Этим условием 
мы хотим подчеркнуть тот факт, что нервная система живого организма посто- 
янно в течение всей жизни накапливает знания о свойствах среды, об объекте 
управления (ОУ), о самой себе, т. е. речь идет о знаниях свойств всей системы. 
Если некоторым способом оценить объем знаний, которыми располагает УС, 
то очевидно, что этот объем растет в течение всей жизни организма, начиная 
с некоторого ненулевого начального его уровня, о необходимости которого мы 
скажем немного позже. 

В определенном смысле объем знаний о функциональных свойствах си- 
стемы связан с величиной неопределенности знаний. Неопределеность знаний 
оценивается через энтропию информации и тем самым может быть выра- 
жена количественно. Напомним, что представляет собой понятие энтропии 
информации. Пусть некоторый субъект ставит эксперимент, который может 
завершиться одним из № ожидаемых управляющей системой исходов. Пусть р; 
суть известные субъекту вероятности этих исходов. Тогда общая неопреде- 
ленность ситуации, или неопределенность ожидаемого субъектом результата, 
эксперимента, может быть оценена с помощью величины, которая называется 
энтропией информации и равна 


м м 
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Чем больше число № возможных исходов при равной вероятности их 
появления, тем выше энтропия — выше неопределенность ситуации. Если веро- 
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ятности исходов не одинаковы, то определенность ситуации выше, а энтропия 
меньше. 

Понятие энтропии позволяет также оценить количество информации, при- 
носимой некоторым сообщением (результатом эксперимента). Так, пусть в ис- 
ходной ситуации имела место неопределенность, оцениваемая величиной эн- 
тропии Но (например, мы не знаем, какие именно карты в руках у партнера). 
Неопределенность этой ситуации может быть рассчитана, пусть она равна Но. 
Пусть в результате некоторого эксперимента мы получили сообщение, что 
у нашего партнера в руках точно нет таких-то именно карт. Неопределенность 
осталась, но она стала меньше, пусть она стала равна Н. Тогда говорят, 
что данное сообщение (эксперимент) принесло нам информацию, количество Г 
которой равно убыли энтропии 


І= Н Н.. 


Знания управляющей системы связаны с энтропией в том смысле, что от 
объема знаний, которыми располагает УС, зависит неопределенность той ре- 
акции среды, которую ожидает УС от совершения своих действий. Например, 
ребенок, обладающий сравнительно небольшим объемом знаний, плохо пред- 
ставляет себе возможные следствия какого-либо действия в отношении, напри- 
мер, некоторых объектов, о которых он знает. Напротив, взрослый человек, 
имеющий больше знаний, представляет себе последствия этого же действия 
в отношении этих же объектов более определенно. Это позволяет говорить, что 
энтропия (неопределенность) знаний ребенка выше энтропии знаний взрослого 
человека, и что неопределенность знаний организма в процессе развития его 
нервной системы уменьшается. Однако это справедливо только в том случае, 
если и ребенок, и взрослый имеют в виду одинаковое число объектов, а разница, 
состоит лишь в определенном понимании того, как именно данное действие 
повлияет на эти объекты. Если же число учитываемых объектов различно, 
то различна и начальная энтропия. Так, взрослый человек держит под кон- 
тролем больше объектов, чем ребенок, и его энтропия будет выше (вспомним 
высказывание Анаксимена, приведенное в начале книги). В целом, энтропия 
наших знаний изменяется следующим способом. Как только мы узнаем о су- 
ществовании нового объекта (образа), энтропия сразу увеличивается скачком. 
А по мере того как мы больше узнаем о свойствах этого объекта, энтропия 
постепенно спадает. В разд. 3.3.5 на рис. 3.63 будет показан график, который 
на примере конкретной системы (мобильный робот Гном №8) показывает, как 
со временем энтропия знаний управляющей системы, построенной на основе 
рассматриваемого здесь принципа ААУ, увеличивается скачками в момент 
появления нового образа, и постепенно спадает по мере накопления знаний 
о том, как обращаться с этим образом. Однако если измерять энтропию отно- 
сительно некоторого фиксированного объема объектов-образов, который УС 
может усвоить в течение своей жизни (например, можно отталкиваться от 
предельной емкости памяти УС), то число объектов не будет изменяться, 
и энтропия знаний УС будет только падать по мере освоения свойств этих 
объектов. Это соответствует требованию из юридической практики: «незнал 
ние закона не освобождает от ответственности». В этом смысле взрослый 
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человек действительно обладает меньшей энтропией, чем ребенок. Точные 
количественные характеристики знаний на основе энтропийных оценок будут 
рассмотрены в гл. 3. 

Итак, принимаем условие, что в начальный момент управляющая система, 
обладает наибольшей неопределенностью своих знаний, и в процессе жизни 
эта неопределенность должна уменьшаться, а объем накопленных знаний, 
соответственно, должен увеличиваться. Это свойство для нас тесно связано 
с понятием адаптации управляющей системы к свойствам системы «среда — 


ОУ — УС». 


2.10. Условие наибольшей начальной 
приспособленности объекта управления 


В настоящей работе мы делаем попытку понять и смоделировать принципы по- 
строения адаптивных управляющих систем, которые, как нам кажется, можно 
наблюдать в нервных системах всех живых организмов. Идея адаптивного 
управления основана на наблюдении, что у всех живых организмов можно 
видеть много общего в структуре и принципах действия их нервных систем. 
В частности, нервным системам всех организмов присущи те свойства, которые 
мы выше назвали «условиями» автономности, дискретности, способности нал 
капливать информацию. Далее мы показали, что общим является и свойство 
адаптивности, как и механизмы ее реализации. Собственно, моделированию 
адаптивного принципа действия нервной системы и посвящена эта книга. Это 
очень важное свойство нервных систем, как, впрочем, и всех организмов, 
состоит в их динамичности, постоянной изменчивости, способности к зарож- 
дению, росту, развитию, обновлению, деградации, умиранию. Наверное, нет 
такого аспекта в живом организме, который бы не претерпевал изменения 
в течение жизни организма. По-видимому, всеобъемлющая изменчивость жи- 
вого, динамичный механизм постоянного возобновления жизни во все бо- 
лее приспособленных формах, эволюционное развитие биологических видов, 
приспособляемость каждого отдельного индивида, и есть тот универсальный 
способ приспособления живого к окружающей среде, который существует 
в природе. Этот механизм приспособления пока остается в целом непонятым. 
Можно говорить, что этот механизм является многоуровневым и реализуется 
через различные приспособительные процессы (главный из которых — само 
зарождение жизни, остается непонятным): развитие и дифференциацию форм 
жизни, формирование, эволюцию и развитие органов, зарождение, смену и эво- 
люционное развитие видов, пренатальное и постнатальное развитие индивидов 
и другие процессы. Приспособление организмов на каждом уровне ограничи- 
вается рамками, свойственными этому уровню. Но разные уровни дополняют 
друг друга, расширяя диапазон возможного приспособления до очень широких 
границ. Например, в этой работе мы уделили наибольшее внимание механизму 
адаптации, который осуществляется за счет обучения нейронов в нейросети. 
Однако возможность такой адаптации существенно ограничивается «тополо- 
гией» сети нейронов, т. е. составом и структурой сети нейронов. Какими бы 
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мощными и гибкими ни были возможности отдельного нейрона как само- 
обучаемой системы распознавания, возможности к обучению и переобучению 
сети будут сильно ограничены, если сеть не может перестраиваться по ходу 
обучения. Если сеть нейронов имеет возможность расти и перестраиваться 
в течение всей жизни организма, то это во много раз увеличивает способность 
нервной системы приспосабливаться и обучаться. Независимо от того, может 
ли перестраиваться нервная сеть в течение жизни, очевидно, что к моменту 
рождения организма конфигурация нервной сети, как и всех других подсистем 
организма, находится в оптимизированном виде, которое природа нашла для 
этого «стартового» состояния. 

Исследованиями механизмов приспособления форм жизни занимается эво- 
люционная биология (теория эволюции, эволюционная генетика, и др.). По- 
пытки моделирования этих приспособительных процессов в точных науках 
осуществляются в синергетике, теории автоматов, генетических алгоритмах, 
некоторых других методах и подходах к эволюционной оптимизации и вообще 
оптимизации. Создаются математические модели некоторых процессов эволю- 
ционного развития и оптимизации, которые находят практическое применение. 
Известны даже попытки выращивания в компьютерных экспериментах неко- 
торых виртуальных «организмов». Но все это только первые начальные шаги 
в поиске природного метода приспособления и развития организмов. В прак- 
тической области пока нет примеров искусственных систем (материальных, 
а не виртуальных), способных к автоматическому развитию, подобному жи- 
вым организмам. Ничего даже приблизительно похожего мы не видим сегодня 
в технике и технологиях. Мы собираем искусственные объекты из отдельных 
узлов, и они «появляются на свет» уже в готовом виде, после чего функциони- 
руют без какой-либо автоматической адаптации, постепенно разрушаясь, пока 
не наступает момент их списания и отправления на свалку. Нет даже намеков 
на технологию, при которой искусственный объект мог бы автоматически за- 
рождаться, расти, развиваться, изменяться, приспосабливаться, обновляться, 
передавать свои признаки и накопленные знания по наследству, деградировать 
и умирать, вовлекаясь во всеобщий процесс многократного использования 
материи. По-видимому, мы еще очень далеки от технологий такого рода. 

Тот вид изменчивости, моделированию которого в основном посвящена эта 
книга, касается лишь одного из названных выше механизмов приспособле- 
ния — это изменчивость информации, знаний, которые накапливает и исполь- 
зует уже сложившаяся нервная система. Мы будем называть «адаптацией» 
именно этот вид изменчивости нервной системы в зависимости от условий 
существования организма. 

В этой работе мы стараемся рассматривать такой механизм приспособле- 
ния, который связан с накоплением и изменчивостью информации и знаний 
в нервной системе. Если бы можно было предположить, что передача инфор- 
мации в нервной системе связана только с передачей нервных импульсов по 
нервным волокнам, а накопление информации, знаний — с ростом, например, 
синапсов в нейронах, то можно было бы сказать, что мы касаемся только 
этих механизмов. Собственно, с такого подхода и начиналось данное исследо- 
вание. Однако со временем приходило понимание, что передача информации 
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в нервной системе связана не только с нервной импульсацией. Вовлеченными 
в этот процесс оказываются, как минимум, и диффузионное движение ме- 
диаторов, и их химическая активность. А накопленная информация, знания, 
хранятся в нервной системе не только в синапсах, но во всех элементах ее 
«конструкции». Это и оптимальная топология нервной сети, и оптимальная 
толщина нервных волокон, обеспечивающая необходимую скорость передачи 
нервных импульсов и т. д. до мельчайших деталей, поскольку каждая такая 
деталь оптимальна и является результатом эволюционного приспособления. 
Другое дело, что эти «элементы памяти» имеют разную «скорость перезаписи» 
информации. Например, возбуждение нейрона, связанное с деполяризацией 
его мембраны, представляет собой очень быстродействующий процесс записи 
информации в нейрон, но хранится эта информация очень недолго. Запись 
информации, знаний в топологию нервной сети (образование новых межней- 
ронных соединений, отмирание связей и нейронов) требует долгого времени, 
но и действовать такая информация (знания) будет долго. Запись информации 
в хромосомный наследственный код — это способ сохранения информации 
и знаний очень надолго, ею будут пользоваться многие и многие поколения 
представителей данного биологического вида. 

В нашей работе мы больше сосредоточимся на процессах передачи инфор- 
мации с помощью нервных импульсов и процессах записи информации с по- 
мощью изменения размеров синапсов. При этом по необходимости придется 
касаться и более долговременных механизмов записи знаний в виде топологии 
сети нейронов и некоторых параметров нейронов. 

Возвращаясь к проблеме адаптивного управления, отметим в этой связи, 
что всякий живой организм, индивид, даже в первый момент своей жизни 
уже есть результат длительного приспособления, полученного им в процессе 
реализации тех механизмов адаптации, которые перечислены в данном раз- 
деле. Если бы можно было каким-то способом сравнить ту долю адаптации 
организма к среде, которая реализуется в течение жизни его нервной системой, 
с долей, которая приходится на все остальные механизмы приспособления 
(эволюционное приспособление на множестве поколений предков данного ин- 
дивида и т. д.), то мы даже примерно не можем оценить отношение этих долей, 
хотя предполагаем, что оно далеко не в пользу первого. Все в организме 
индивида приспособлено к условиям проживания его вида — органы чувств 
(датчики), исполнительные органы, способность к распознаванию необходи- 
мых классов образов, начальные поведенческие реакции и многое другое. 

Выше мы писали о необходимости априорной информации в работе распо- 
знающих систем. Это и является обоснованием последнего из главных условий, 
которые мы предъявляем к модели нервной системы — необходимости макси- 
мальной начальной приспособленности объекта управления и управляющей 
системы к среднестатистическим условиям существования объектов данного 
вида. 
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2.11. Состав и функции подсистем 
адаптивной системы управления 


Теперь, когда мы составили общее представление о системе, в составе которой 
находится конструируемая нами управляющая система, об условиях, которым 
должна удовлетворять эта управляющая система, и о ее целевых функциях, 
можно перейти к конкретизации устройства этой управляющей системы, ко- 
торое вынужденно вытекает из названных исходных положений. 

Дадим сначала краткое описание идеи адаптивного управления, соответ- 
ствующее нашему методу, чтобы у читателя сложилось общее представление 
о сути подхода, после чего опишем детали более подробно. 

Будем рассматривать тот уровень управления, который связан с передачей 
нервных импульсов и записью информации в нейроны, например, в виде изме- 
нения размеров синапсов и уровней порогов, определяющих запуск некоторых 
механизмов в нейронах. 


Аппарат эмоций 


Какой бы механизм ни представляла собой нервная система, в ее составе 
должно быть нечто, что заставляет ее работать. Нужно ввести в состав этой 
управляющей системы источник «движущей силы». Чтобы заставить работать 
часы, мы помещаем в них либо гирю, опускающуюся под действием земного 
притяжения, и далее дозированно распределяем по часовому механизму 
движение гири, либо сжатую пружину, которая, распрямляясь, приводит 
в движение шестерни, либо движущей силой служит батарейка. Движущей 
силой, заставляющей работать современный компьютер со всеми его програм- 
мами, является разность электрических потенциалов в источнике питания, 
подобно тому, как разность уровня воды в плотине заставляет крутиться 
жернова мельницы. А что является движущей силой в системе управления 
живого организма? Ведь для того, чтобы обеспечить выживание организма, 
поиск и накопление новых знаний, управляющей системе — мозгу нужно 
совершать серьезную интеллектуальную работу. Что заставляет организм 
выполнять эту работу? Господь Бог придумал очень изящное решение. 
В нервную систему каждого организма он вложил специальную батарейку — 
аппарат эмоций. Устроена она так. Имеется «прибор» со «стрелкой», которая 
может отклоняться по шкале от состояния «невыносимо плохо» до состояния 
«прекрасно, лучше не бывает» с промежуточными значениями, которых не так 
уж и много — что-то около десятка. В середине шкалы имеется нейтральное 
значение, делящее шкалу на две области — «приятную» и «неприятную». 
Сделано так, что если стрелка смещается в «неприятную» сторону, нервная 
система чувствует себя плохо, она просто не может этого выносить, и старается 
выйти из этого состояния. Если стрелка смещается в «приятную» сторону, 
нервной системе хорошо, она стремится продлить это состояние и сделать его 
еще более приятным, переместить стрелку еще глубже в «приятную» область 
шкалы. Один из студентов метко назвал аппарат эмоций «хорошометром». 
Текущее показание аппарата, эмоций будем называть «текущей эмоциональной 
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оценкой». Гениальное изобретение Природой аппарата эмоций сразу же 
решило проблему движущей силы для управляющей системы. Движущая 
сила для процесса управления, осуществляемого нервной системой 
живого организма, состоит в постоянном стремлении уйти от 
неприятных эмоциональных оценок и перейти в состояния, которые 
дают приятные эмоциональные оценки. Можно назвать эту движущуюся 
силу универсальной «мотивацией» нервной системы. 

Однако аппарат эмоций устроен так, что у организма отсутствует возмож- 
ность передвинуть эмоциональную оценку «вручную», внутри самой нервной 
системы. Природа специально позаботилась об этом и нагородила множество 
преград для такого «ручного» управления эмоциями. Очень трудно по жела- 
нию повысить себе настроение без особых усилий. Конечно, изобретательный 
человек нашел лазейки для короткого пути к воздействию на свой аппарат 
эмоций. В этом арсенале и алкоголь, и наркотики, и прочие талантливые 
изобретения, остроумно обманывающие природу. Известен эксперимент с кры- 
сой, которой был вживлен электрод прямо в аппарат эмоций таким образом, 
что при нажатии на педаль крыса сразу получала очень приятную эмоцию. 
Крыса закончила свою жизнь в состоянии полного счастья не отходя ни 
на шаг от педали. Однако штатным способом воздействия на аппарат эмоций, 
задуманным Природой, является способ, который одновременно приводит 
к выживанию и развитию организма. Этот способ состоит в целенаправлен- 
ном воздействии на окружающую среду с целью получения от нее такой 
реакции, которая, будучи воспринятой органами чувств организма, приведет 
к желаемому перемещению «стрелки» аппарата эмоций в сторону более «при- 
ятных» эмоциональных оценок. Это достигается тем, что штатными входами 
аппарата эмоций являются выходы распознающей системы, в частности — 
выходы органов чувств. Итак, штатным способом ухода от состояний, дающих 
«неприятные» эмоциональные оценки, и перехода в состояния с «приятными» 
эмоциональными оценками, является целенаправленное воздействие на среду. 

Поскольку выходы рецепторных и нейронных клеток органов чувств 
и системы распознавания бинарны, т. е. формально равноценны, то каким-то 
способом должно быть установлено правильное отображение между вектором 
выходных бинарных сигналов распознающей системы и показанием стрелки 
аппарата эмоций. Это правильное, близкое к оптимальному отображение для 
каждого организма, по-видимому, было найдено в процессе естественного 
отбора. Например, пусть у индивидов одной популяции некоторого архаи- 
ческого вида рыб было различное отображение показаний термодатчиков 
на множество эмоций. Одним рыбам была приятна горячая вода, другим — 
холодная. Со временем в живых оставались только те рыбы, у которых 
отображение было удачным, и которым «приятно» было именно в той 
воде, которая обеспечивала им выживание. Еще более тонкая настройка 
отображения происходила у их потомков и т. д. 

Надо сказать, что несмотря на очень большое число параметров, кото- 
рые воздействуют на организм, эмоциональная оценка текущего состояния 
в каждый момент только одна. Но это интегральная оценка, она интегри- 
рует в себе множество различной информации. В существовании такой еди- 
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ной эмоциональной оценки каждый может убедиться, если спросит себя или 
своего ближайшего соседа: «как тебе сейчас?». Ответ вида «да так себе» 
или «неважно» и есть словесное выражение этой его текущей эмоциональ- 
ной оценки. На вопрос «почему неважно?» человек может долго перечис- 
лять составляющие этой интегральной оценки — эмоциональные оценки раз- 
ных распознанных образов — некоторые с плюсом, некоторые с минусом. 
Если смотреть более глубоко, то можно видеть, что эмоциональных оценок 
несколько. Но они делятся не по образам, а по классам образов: в частности — 
эмоциональные оценки прошлого, текущего и ожидаемого в будущем состоя- 
ний. Видимо, все эти оценки отражаются на лице человека в определенных 
для них зонах лица — лоб, брови, глаза, губы. Лицо с его «эмоциональ- 
ным интерфейсом» позволяет человеку быстро передавать другим людям эту 
важную для них эмоциональную информацию, необходимую для управления 
в коллективе. 

Обычная простая ситуация такова — враждебная окружающая среда, ста- 
рается ввести нас в неблагоприятное для нас состояние. Аппарат эмоций 
реагирует на это «неприятной» эмоциональной оценкой. Человек, как и любое 
другое живое существо, старается сделать все возможное, чтобы повысить 
свою текущую эмоциональную оценку в более или менее отдаленном буду- 
щем, выбирая оптимальный вариант будущего именно по прогнозируемым 
им эмоциональным оценкам. Но найти такие воздействия на среду, которые 
могли бы помочь организму целенаправленно выходить из плохих состояний 
и переходить в хорошие — дело непростое. Знания о таких воздействиях трудно 
добыть и их надо тщательно сохранить, поскольку они очень ценны для любого 
организма. 

Итак, уже из сказанного видно, что аппарат эмоций решает несколько раз- 
личных задач и является сложной многофункциональной подсистемой нерв- 
ной системы, которая устанавливает отношение между состояниями системы 
и эмоциональными ощущениями организма. Кроме того, аппарат эмоций за- 
дает постоянное стремление нервной системы к улучшению эмоциональных 
ощущений, тем самым являясь причиной постоянной внутренней активности 
организма. Для нас важно, что 


а) у каждого живого организма есть некоторая шкала эмоциональных 
оценок для своих состояний; 

б) аппарат эмоций умеет рассчитывать интегральную эмоциональную 
оценку текущего состояния ОУ; 

в) в нервной системе «зашито» постоянное стремление к достижению более 
высоких эмоциональных оценок. 


Ниже мы опишем аппарат эмоций более подробно и формально, а также по- 
кажем, что он очень просто программируется. Здесь же отметим, что введе- 
нием аппарата эмоций мы в некотором смысле «одушевили» управляющую 
систему, во всяком случае, управляющая система теперь всегда может от- 
ветить на вопрос «как тебе сейчас?» и всегда стремится к тому, чтобы ей 
было «хорошо». Перейдем к рассмотрению способов, которыми управляющая 
система может этого добиваться. 
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Что должно происходить в управляющей системе, чтобы она могла при- 
способиться к системе «среда — ОУ — УС» с заранее не известными или 
мало известными ей свойствами? Для понимания вынужденной логики этого 
воспользуемся приемом, известным как «демон Максвелла», т. е. гипотети- 
ческим наблюдателем, которого мы мысленно помещаем в нужную нам для 
наблюдений точку экспериментальной установки. Поместим демона внутрь 
нашей управляющей системы (УС на рис. 2.9) как в «черный ящик» и будем 
спрашивать его, что ему требуется для решения тех задач, которые стоят перед 
управляющей системой, т. е. попросту для выживания. 

При введении фигуры демона возникает некоторое неудобство из-за, того, 
что появляются два аппарата эмоций, потому что демон, как живое существо, 
тоже обязан иметь свой аппарат эмоций. Но пусть в нашем эксперименте 
аппарат эмоций управляющей системы и аппарат эмоций демона работают 
синхронно и просто дублируют друг друга. (Пусть то, что «хорошо» для 
управляющей системы, хорошо и для демона, в чем демон может убедиться, 
наблюдая показания своего аппарата, эмоций. Будем считать это результатом 
предварительной настройки аппарата эмоций в процессе эволюционной опти- 
мизации.) Ниже будем говорить о них, как об одном аппарате эмоций. 

Демон, конечно, понимает, что если он не найдет способа управления систе- 
мой, то может погибнуть, так как догадывается, что его «черный ящик» управ- 
ляющей системы помещен в некое «тело» (ОУ), которое окружено враждебной 
ему окружающей средой. Демон, конечно, захочет избежать гибели (целевая 
функция «выживание»), и сам поймет, что для этого ему надо найти способ 
управления этой системой (целевая функция «накопление знаний»). Дадим 
демону некоторую фору, пусть этот ОУ поначалу находится в сравнительно 
благоприятной среде. 

Пусть с одной стороны «черного ящика» УС демон может видеть экран, 
на котором зажигаются лампочки от бинарных сигналов, приходящих с неиз- 
вестных демону датчиков, расположенных вне УС. Экран этот обширен — у че- 
ловека только зрительных рецепторов более миллиона, а есть еще слуховые, 
тактильные и множество других рецепторов. 

Пусть с другой стороны «черного ящика» УС имеется пульт («командный 
пульт») с множеством пронумерованных кнопок, нажимая на которые, демон 
может включать и выключать неизвестные ему исполнительные органы, нал 
ходящиеся за пределами УС. Эти кнопки являются единственными выходами 
управляющей системы. 

Будем отмечать, какое оборудование и информацию просит от нас демон, — 
это и составит в итоге внутренне устройство УС. Будем отмечать также после- 
довательность действий демона, — это составит искомый алгоритм адаптивного 
управления. 


Образы и подсистема формирования 
и распознавания образов 


Обнаружив методом проб и ошибок, что на пульте управления нет кнопок, 
непосредственно влияющих на его эмоции, демон понимает, что повлиять 
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на текущую эмоциональную оценку можно только с помощью воздействий 
на внешнюю среду. Демон принимает гипотезу, что внешняя среда обла- 
дает некоторыми закономерными свойствами, ибо гипотеза о ее стохастич- 
ности означает для него неизбежную гибель. Будучи несколько образован 
в логике, демон понимает, что закономерности среды должны проявляться 
в причинно-следственных связях состояний среды и его действий. А именно, 
демон разумно решает, что ему следует искать закономерные переходы от 
определенных состояний среды и совершаемых им действий к другим опре- 
деленным состояниям среды, что повлечет определенные изменения эмоций. 

Прежде всего для распознавания определенных состояний среды демон 
должен научиться «узнавать» на экране входной информации какие-то 
комбинации сигналов, которые для него будут выделяться, отличаться от всего 
остального случайного, на его взгляд, потока входных сигналов. Необходимо, 
чтобы демон в какой-то момент мог сказать себе, например: «О, вот эта 
мигающая вытянутая фигура в нижнем правом углу экрана появлялась уже 
несколько раз, я узнаю ее!». С этого момента демон всегда будет узнавать этот 
образ — комбинацию сигналов в виде мигающей вытянутой фигуры, всякий 
раз, как только он будет появляться на экране. Вся остальная информация 
на экране входной информации для демона пока не различима, неузнаваема, 
неинформативна. 

Демон может потребовать от нас карандаш и блокнот, который он назо- 
вет «Память УС», создаст там раздел «Память образов», и запишет туда: 
«Образ №1 сформирован в такое-то время, его прообраз есть...» и зарисует 
вытянутую фигуру с ее характерными признаками. Это, безусловно, долго- 
временная память. Демону в общем случае незачем забывать об однажды 
сформированных образах — они есть результат определенного труда и отра- 
жают некие неслучайные явления в системе, что является ценным элементом 
эмпирических знаний демона и УС. Текущие данные изменяются во времени 
(рис. 2.12; экрану демона соответствует один вектор-столбец). Рамками мы 
обвели прообразы некоторых образов, которые демон уже научился распоз- 
навать. 
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Рис. 2.12. Пример потока входной бинарной информации, 
в которой можно выделить повторяющиеся фрагменты 
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При дальнейших наблюдениях демон может обнаружить и другие харак- 
терные неслучайные комбинации — образы, записями о которых он пополнит 
свою «Память образов». Теперь, наблюдая экран, демон сможет говорить, кал 
кие из уже известных ему образов он распознает, наблюдает в текущий момент. 
Появившись на экране, прообраз может держаться на нем некоторое время 
(образ распознан), после чего прообраз исчезает, и демон говорит, что образ 
вытеснен, но, конечно, какое-то время помнит, что этот образ был распознан. 
Мы можем сказать демону, что его «Память образов» является, по сути, «де- 
кларативной памятью», отражающей в терминах «образов» список объектов, 
различимых демоном. Содержимое такой декларативной памяти — множество 
сформированных образов, конечно, составляет важную часть знаний демона, 
но это односторонние знания, ими еще нельзя пользоваться для управления. 

Демон может распознавать одновременно и несколько уже известных ему 
образов. Если одновременно распознаваемых образов много, демон заведет 
в своем блокноте специальное поле «Память распознанных образов», куда 
будет записывать номера тех образов, которые распознаны, отмечая моменты, 
когда они исчезают с экрана. Мы бы не советовали демону превращать «Па- 
мять распознанных образов» в кратковременную память и стирать запись 
об образе сразу после его вытеснения, потому что, анализируя на досуге 
архив «Памяти распознанных образов», демон может обнаружить в ней много 
полезных закономерностей — знаний о свойствах системы. 

Итак, мы видим, что демон уже решает две непростые задачи: 

а) формирует образы; 

б) распознает уже сформированные образы, наблюдая в реальном времени 

экран входной информации. 

Это основные задачи, но кроме них, демон делает и несколько других 
вспомогательных операций — пополняет «Память образов» и ведет хронику 
событий в «Памяти распознанных образов», оставляя старые странички для 
архива. 


Знания и База Знаний 


Теперь демон пытается реализовать свое активное начало, которое состоит 
в его горячем желании выжить и любопытстве (жизненно важной необходи- 
мости поиска и накопления знаний), заставляющем демона искать способы 
управления ситуацией. Наблюдение входной информации и работа с нею — это 
хотя и активность, но пассивная — демон все еще не может влиять на систему. 
Влиять на события демон может только с помощью кнопок, расположенных 
на выходном командном пульте системы управления. Если никаких априорных 
знаний о способах управления ОУ у демона нет, то ему придется искать такие 
знания самостоятельно. 

При полном отсутствии начальной информации демон вынужден дей- 
ствовать методом «перебора». Демон начинает нажимать на те или иные 
кнопки, наблюдая за экраном входной информации. И вот однажды демон 
обнаруживает, что нажатие на кнопку У вызывает распознавание образа 4, 
но это происходит не всегда, а только если вначале был распознан образ Х. 
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Обнаружив эту закономерность, демон заводит в своем блокноте новый раздел, 

назвав его «База Знаний», и записывает туда: «Если при распознавании об- 

раза Х нажать на кнопку У’, то через такое-то время будет распознан образ 4». 
В более короткой записи это может выглядеть так: 


Образ Х (81) = 1 — кнопка У (№) — распознавание образа 7 (#3). (1) 


Знания вида (1) можно назвать «процедурными знаниями», поскольку они 
содержат инструкции о том, как получить тот или иной отклик системы. Везде 
ниже под «знаниями» мы будем понимать именно эти знания, оговаривая 
отдельно другие случаи. 

Как только демон нашел хотя бы одну закономерность такого рода, то 
тем самым произошло качественно новое событие — демон научился управ- 
лять системой «среда — ОУ -УС»! Однако это хотя и важное, но пока еще 
очень маленькое знание, состоящее лишь в том, что демон может в редких 
условиях (надо пассивно дождаться появления образа Х) целенаправленно 
вызвать распознавание образа 7. Даже для управления образом Й этого 
знания недостаточно, потому что демон не умеет еще вытеснить распознавание 
образа 2С. Поскольку все явления, объекты и процессы внешнего мира демон 
воспринимает только в виде образов (бинарных векторов сигналов), то мани- 
пулирование этими внешними объектами подразумевает, как минимум, умение 
вызвать распознавание образа и умение вызвать вытеснение этого образа. 
Понаблюдайте за маленьким ребенком — вначале он учится именно этим двум 
действиям — умению взять игрушку и умению отбросить ее, умению вызвать 
маму и умению отдалить ее, и т. д. 

Итак, теперь демон будет методом «проб и ошибок» искать способ вызвать 
вытеснение распознанного образа. Возможно, что ему рано или поздно это 
удастся, и он найдет такое элементарное знание, как 


Образ 2(#) = 1 — кнопка И (+2) — вытеснение образа 7 (3). (2) 


Понятно, что такое знание может быть найдено не сразу, как далеко не 
сразу находятся способы лечения болезней и выхода из каких-то ситуаций. 
Но в процессе поиска очень вероятно, что демон неожиданно для себя найдет 
и другие знания видов (1) и (2), и пополнит ими свою «Базу Знаний». 

Кроме того, в процессе такого поиска демон может обнаружить, что со- 
вершенно аналогичным примеру (1) свойством обладает кнопка, например, У, 
т.е. справедливо 


Образ Х (81) = 1 -+ кнопка У (№2) — распознавание образа 7 (#3), 
и тогда демон объединит эту запись с записью (1) и получит 
Образ Х (01) =1-+ кнопки (У или У)(Ь) — распознавание образа 7 (#3). 


Список кнопок, обладающих абсолютно идентичными свойствами по от- 
ношению к образам в некотором конкретном элементарном знании, может 
постепенно расширяться. Тогда демон называет такой список альтернативных 
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кнопок «действием» и указывает только его номер, а сами списки альтерна- 
тивных кнопок для известных ему «действий» хранит отдельно. 

Кроме того, первая часть записи знания (1), по сути, означает условие, 
при котором данное знание справедливо, и это «условие» представлено логи- 
ческим выражением от распознанных и нераспознанных в текущий момент 
образов. Вторая часть записи (1) состоит из указания «действия». А третья 
часть записи знания (1) в общем виде может состоять из списка образов, 
которые будут распознаны, и образов, которые будут вытеснены в результате 
совершения указанного «действия» при наличии указанного «условия». Этот 
список назовем «результатом». Получаем следующую запись элементарного 
знания (1): 

Условие (#1) — действие (12) — результат (#3). (3) 


Например, такое эмпирически обнаруженное демоном закономерное знание 
может отражать следующее свойство системы: «если образы 22 и 15 распо- 
знаны, то нажатие на одну из кнопок 5, 14, 88 или 105 в следующий момент 
вызовет распознавание образов 34, 45 и 78, а также вытеснение образа 22». 

Накапливая эмпирические знания вида (3), демон пополняет свою «Базу 
Знаний». При этом он может упорядочить и структурировать записи, так как 
в них явно можно навести порядок некоторым способом. Для простоты можно 
представлять «Базу Знаний» просто списком элементарных знаний. 

Как только в «Базе Знаний» демона появились первые записи, демон может 
начинать управлять системой. Однако такие знания отражают только связи 
между параметрами системы, но для демона крайне важно понять связь 
образов и знаний с текущими эмоциональными оценками, потому что, по 
большому счету, это — главное, что его интересует. 


Аппарат эмоций подробнее 


Прежде всего уточним, что же является входной информацией для аппарата 
эмоций. Нам представляется, что входной информацией для аппарата эмоций 
служат распознанные образы, но не просто сигналы от образов, а некоторые 
эмоциональные оценки, которыми оснащаются все образы. Каждый образ 
снабжается своей эмоциональной оценкой из некоторой упорядоченной их 
шкалы. Аппарат эмоций собирает эмоциональные оценки всех распознанных 
в текущий момент образов и некоторым способом их усредняет, выдавая 
интегральную эмоциональную оценку текущего состояния ОУ. Такая оценка 
будет существовать всегда, если распознан хотя бы один образ. 

Выше мы говорили о необходимости априорной информации, о необходимо- 
сти максимальной начальной приспособленности ОУ к условиям существовал 
ния в его среде. Такая априорная информация может быть выражена, в част- 
ности, в том, что к моменту своего рождения организм уже оснащается неко- 
торым множеством сформированных образов вместе с их эмоциональными 
оценками. Например, это «очень плохой» образ голода, который распознается 
организмом сразу без обучения, как только желудок оказывается пустым 
(для этого желудок оснащен соответствующими рецепторами), и «очень хоро- 
ший» образ сытости при наполненном желудке, и «плохой» образ чрезмерной 
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сытости, который распознается, когда желудок оказывается переполненным 
(специальные рецепторы), образ чрезмерного холода, который распознается 
организмом, как только температура оказывается опасно низкой, и образ 
слишком высокой температуры и т. д. Каждый из этих образов сразу снабжен 
своей эмоциональной оценкой. Эти оценки должны быть объективными в том 
смысле, что образ должен иметь «хорошую» оценку, если отражаемое им 
явление действительно полезно для организма, для его целевых функций — 
выживания и накопления знаний, а образы опасных или вредных для данного 
организма явлений должны быть снабжены «плохими» оценками. Оценки 
для таких изначально сформированных образов находятся опытом многих 
предыдущих поколений предков данного организма, методом проб и ошибок. 
Организмы с неправильными оценками изначально сформированных образов 
вымерли, не оставив потомства, а выжили только организмы с удачными оцен- 
ками. Можно даже предполагать, что некоторые рецепторы и, соответственно, 
образы, могут специализироваться для работы только на аппарат эмоций. 

Нам представляется, что аппарат эмоций, в силу описанных его свойств 
и благодаря изначально сформированным образам, является подсистемой, 
сравнительно малозависимой от сознания организма, она более архаична, бо- 
лее фундаментальна, чем сознание. Так, новорожденный организм, еще ничего 
не понимая в окружаюшей обстановке, распознавая только свои изначально за- 
данные образы, уже чувствует работу аппарата эмоций, чувствует болевые или 
приятные ощущения. Реагируя поначалу на гораздо большее число датчиков, 
чем сознание, аппарат эмоций тем самым «учит» высшую нервную систему, 
ее «сознание» прислушиваться к этим датчикам, учитывать их при принятии 
решений, вводить их в «Базу Знаний». В этом смысле аппарат эмоций является 
«учителем» для самообучаемой автономной управляющей системы. 

Вернемся к демону. Как было сказано, демон имеет свой аппарат эмоций 
и может пользоваться им, сидя в «черной комнате» УС, непосредственно 
ощущая пользу того или иного образа — образы могут отражаться на из- 
менении температуры или давления, на появлении пищи и т. п. Однако нам 
надо с помощью демона построить полностью автоматическую управляющую 
систему. Поэтому займемся детализацией и конструированием искусственного 
аппарата эмоций. 

Для начала потребуем, чтобы в нашей УС имели место некоторые изна- 
чально сформированные образы, уже снабженные эмоциональными оценками. 
Эмоциональная оценка образа может быть представлена числом из некото- 
рого множества мощности /. Пусть, например, это множество имеет вид 
{—20, —19,...,—1,0,1,2,...,20}, здесь 2 = 41. Определим правило вычисле- 
ния среднего на этом множестве оценок. Установим вычислитель, который бу- 
дет вычислять среднее от эмоциональных оценок всех распознанных в текущий 
момент Ё образов и округлять результат до ближайшего числа 65(1) из этого 
же множества 1—20, —19,...,5(0),...,20}. Пусть аппарат эмоций имеет шкалу 
55 = {—20, —19,...,5(®),...,20}, на которой указывается вычисленная текущая 
средняя эмоциональная оценка 5(1), которую будем называть «интегральной 
эмоциональной оценкой текущего состояния ОУ». Устройство, которое мы 
получили (аппарат эмоций), показано на рис. 2.13. Как только мы подадим 
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на него оценки сформированных и распознаваемых образов, он начнет рабо- 
тать, указывая нам «интегральную эмоциональную оценку текущего состоя- 
ния ОУ» (0). 

Мощность 4 должна быть сравнительно большой для того, чтобы была 
возможность достаточно подробно отобразить широкий диапазон возможных 
эмоциональных оценок, характеризующих качество различных возможных со- 
стояний объекта управления. Однако при принятии решений на практике поль- 
зоваться такой широкой шкалой неудобно при ограниченных вычислительных 
ресурсах нервной системы и требуемой высокой скорости принятия решений. 
Заметим, что отдельно взятый индивид живет в сравнительно стационарных 
условиях с точки зрения их качества — один индивид постоянно живет 
в благополучных условиях, другой может жить в постоянно плохих условиях. 
Изменение средней величины и дисперсии или даже диапазона текущих оценок 
качества жизни происходит сравнительно медленно. Однако оба этих индивида, 
при выражении текущей эмоциональной оценки могут пользоваться одними 
и теми же терминами. У одного индивида «плохой день» может означать, 
что он заработал не так много миллионов, как обычно, а у другого индивида, 
«плохой день» может означать, что он весь день ничего не ел и вообще умирает. 
Это означает, что при управлении организм пользуется не шкалой оценок 6, 
а другой шкалой, которую обозначим через В и назовем шкалой «выраженных 
оценок». Эта шкала имеет меньшую мощность, примерно около 10, а также 
имеет словесное выражение, например, В = {‹«невыносимо плохо», «очень 
плохо», «плохо», «неважно», «так себе», «ни то ни се», «неплохо», «хорошо», 
«очень хорошо», «прекрасно», «великолепно», «лучше не бывает» }. Поэтому 
такие оценки мы будем называть «выраженными». 

Оценки 5(Р) на шкале 5 отображаются в оценку В(Ь на шкале В сле- 
дующим способом. Пусть в течение своей жизни индивид помнит о том, что 
самая плохая из испытанных им оценок 5 была равна биш, а самая хорошая из 
испытанных им оценок была равна бщах, т. е. все испытанные им оценки 5(#) 
не выходили за пределы диапазона [5,.., Этах|. Диапазон [5,.., бшах| натяги- 
вается на диапазон [«невыносимо плохо», «лучше не бывает»]|, а оценка 5($) 
пропорционально отображается в оценку В(®. 

Такой алгоритм получения выраженной оценки В(Ё) позволяет разным 
индивидам, живущим в качественно разных условиях, пользоваться одной 
шкалой оценок для выражения качества текущего состояния, но при этом один 
индивид, живущий в хороших условиях, будет характеризовать свое состояние 
словом «неважно», если у него сегодня жемчуг мелок, а другой индивид, 
живущий в тяжелых условиях, этим же словом «неважно» охарактеризует 
состояние, когда у него щи пустые. 

Очевидно, что в течение жизни индивид может попасть в состояния 
с новыми, не испытанными им ранее оценками 5($), выходящими за пределы 
его диапазона [биш, Эшах|. Тогда диапазон [5иит, Эшах| соответственно расши- 
ряется. Понятно, что при такой операции у данного индивида может произойти 
переоценка ценностей. Если некий образ с его оценкой 5 ранее отображался 
в некоторую оценку В, то после расширения диапазона он может отображаться 
в иную выраженную оценку В. Например, пусть некоторое состояние харак- 
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теризовалось индивидом как «ни то ни се», скажем, возможность молодому 
человеку провести вечер в кругу семьи. Если однажды этот индивид попал 
в состояние, которое существенно понизило известную ему предельную оценку 
ош, Например — служба в армии, то то же самое состояние теперь будет 
характеризоваться этим индивидом термином, например, «очень хорошо». 
Этой математикой объясняется такое наше непривлекательное свойство, как 
невольный подъем эмоций при получении известия, что кто-то попал в тяжелое 
положение. Возможно, этим объясняется и тот факт, что видение последствий 
катастроф, фильмы-триллеры и т. п. тяжелые зрелища привлекают многих 
людей — это может служить простым и надежным способом улучшения 
самочувствия, поднятия своей оценки В(#). Практическую пользу от знания 
этого эффекта можно получить, если воспользоваться древним советом, как 
стать счастливым, — надо поселить дома на некоторое время козу, а потом 
продать ее. 

Однако совсем отказаться от шкалы 5 нельзя, так как нужны средства, 
сравнения качества жизни разных индивидов для отбора полезного всей по- 
пуляции опыта и подобных целей оптимизации вида. 

На рис. 2.13 изображен аппарат эмоций, показывающий выраженную эмо- 
циональную оценку текущего состояния организма. 

Теперь спрашивается: а как демон может оснащать эмоциональными оцен- 
ками новые формируемые им образы? (Не может же предками быть преду- 
смотрена оценка для образа нашего соседа по лестничной площадке.) Здесь 
возможен следующий способ действий. После того как сформирован новый 
образ, демон назначает ему нейтральную эмоциональную оценку, и образ сразу 
же начинает участвовать в работе аппарата, эмоций. Затем демон некоторое 
время наблюдает за тем, что происходит с «интегральной эмоциональной 
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Рис. 2.13. Модель аппарата эмоций. Одна из его функций состоит в вычислении 

оценки текущего эмоционального состояния объекта. Другая его функция состоит в 

задании универсальной мотивации — постоянного стремления к улучшению эмоцио- 
нального состояния 
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оценкой качества, текущего состояния ОУ» в те моменты, когда новый образ 
распознается. Если демон обнаруживает, например, что каждый раз при 
распознавании нового образа «интегральная оценка» повышается в среднем 
на некоторую величину, и это статистически достоверно, то демон присваивает 
новому образу эту эмоциональную оценку. Найденные эмоциональные оценки 
демон может записать в «Памяти образов» рядом с соответствующими обра- 
зами как важный их атрибут. 


Мотивация 


Мы обсудили только некоторые необходимые функции аппарата эмоций. 
Теперь подробнее рассмотрим еще одну очень важную его функцию. Как было 
отмечено, в нервной системе должно быть «зашито» постоянное стремление 
к достижению ббльших эмоциональных оценок. На наш взгляд, эта функция 
тесно связана с таким психофизиологическим понятием, как мотивация. 
Понятие «мотивации» не имеет пока в литературе какого-либо однозначного 
трактования, кроме интуитивного — под этим обычно понимается стремление 
организма к достижению какой-либо цели или к удовлетворению какой-либо 
потребности. Часто говорят, что у живого существа, имеется набор некоторых 
потребностей, при активизации которых возникает мотивация к их удовле- 
творению, и существо начинает активно к этому стремиться. Называют такие 
потребности, как голод, стремление к размножению и еще некоторые. 

В нашем подходе мы полагаем, что у всех организмов главная, универсаль- 
ная, истинная мотивация — это именно постоянное стремление к достижению 
большей общей эмоциональной оценки текущего состояния организма. Но 
поскольку такая оценка складывается из эмоциональных оценок распознанных 
в текущий момент образов, то возникают «потребности» решить эту задачу 
за счет воздействия на прообразы распознанных образов. Это и есть конкрет- 
ные «потребности» организма. Организм в каждой ситуации понимает, какие 
из распознанных им в текущий момент образов имеют наихудшие эмоциональ- 
ные оценки, и стремится эти образы вытеснить. Например, распознан очень 
неприятный образ пустоты в желудке, — возникает «потребность» что-нибудь 
съесть, чтобы этот образ перестал распознаваться — был вытеснен (надо 
сделать так, чтобы пища воздействовала на рецепторы в желудке, и они 
перестали посылать неприятный сигнал). Это пример очень «естественного» 
образа, который, казалось бы, природа могла предусмотреть. Но точно так же 
дело обстоит и с образами, которые природа никак не могла предусмотреть. 
Например, пусть некоторым индивидом распознан неприятный для него образ 
переполнения жесткого диска его компьютера, и возникает соответствующая 
«потребность» совершить действия по очистке диска. Эта потребность никак 
не могла быть предусмотрена природой. Однако потребность возникает, и она 
может быть сильной. Индивид может пожертвовать многим ради удовлетво- 
рения этой «потребности». 

Помимо образов с отрицательными оценками, есть образы с положитель- 
ными оценками. Если нервная система должна стараться вытеснить первые, 
то образы с положительными оценками нервная система старается вызвать, 
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если они не вызваны, и удержать распознанными, если они уже распознаны. 
Например, нам приятно созерцать некую картину, и мы стараемся удержать 
на ней взгляд, пока не появятся образы, которые заставят нас делать иное 
(например, образ усталости). Или, все мы знаем, что хорошо получить боль- 
шой денежный приз, и когда распознается образ условия, позволяющего это 
сделать, возникает соответствующая потребность и мотивация, мы начинаем 
предпринимать какие-то усилия под действием этой мотивации, которая, 
кстати, тоже не предусмотрена природой. 

Итак, мы убеждены, что «потребность» — это естественное следствие 
распознавания любого образа с его отрицательной, либо положительной эмо- 
циональной оценкой, состоящая в естественном желании вытеснить образ 
с отрицательной оценкой, либо распознать образ с положительной оценкой. У 
каждого организма столько потребностей, сколько он сформировал образов. 

Способы удовлетворения потребностей и мотивации мы продолжим рас- 
сматриваль в разделе «Принятие решений». 

Хотелось бы отметить также, что эмоциональные оценки образов, кото- 
рые сформированы любым индивидом, во многих отношениях очень инди- 
видуальны и даже зависят от случайных обстоятельств. Поэтому они могут 
не всегда совпадать с общепринятыми оценками. Это является причиной 
«вредных привычек», «антиобщественных поступков», иногда даже таких по- 
ступков, которые кажутся другим индивидам совершенно алогичными и т. д. 
Управляющая система принимает логичное и наилучшее с ее точки зрения 
решение, но его содержательная часть зависит от конкретных индивидуальных 
эмоциональных оценок образов. Тем самым, устремления и цели индивидов 
разнятся сформированными ими образами и их оценками, а не алгоритмом 
принятия решений. Поэтому, например, при воспитании нужно обращать боль- 
шое внимание на формирование желаемых оценок явлений. 

Следует также понимать, что мотивация — это лишь средство, кото- 
рым природа заставляет организм выполнять его главные цели — выжива- 
ние и накопление знаний. Чтобы заставить организм действовать, природе 
было просто необходимо вложить в него аппарат эмоций с его стремле- 
нием к достижению недостижимых целей — максимально хороших ощуще- 
ний. В этом отношении аппарат эмоций в живом организме играет роль, 
подобную источнику напряжения в электрической схеме. Природное, есте- 
ственное стремление электронов от минуса к плюсу, заставляет их выпол- 
нять ту работу, которую они выполняют в электрических схемах. Отключите 
напряжение, и схема перестанет действовать, «умрет». Аналогично и в жи- 
вом организме — если отключить аппарат эмоций, то организму все станет 
абсолютно безразличным и он перестанет совершать какие-либо движения, 
проявлять какую-либо активность, что наверняка приведет к смерти. Тем 
самым, аппарат эмоций есть источник и причина постоянной внутренней 
активности живого организма. Как бы ему ни было хорошо, живое существо 
всегда будет стремиться к поиску состояний с еще более хорошими эмоцио- 
нальными ощущениями. Попутно организм вынужден удовлетворять и двум 
своим главным целевым функциям — стремиться к выживанию и накапливать 
знания. 
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Немного подробнее остановимся на целевой функции накопления знаний. 
Природе пришлось проявить большую изобретательность для того, чтобы 
заставить организм стремиться к удовлетворению целевой функции накопле- 
ния знаний. Одного рационального соображения, что больший объем знаний 
позволяет достичь больших успехов в борьбе за выживание, по-видимому, 
не достаточно, если речь идет о простых организмах, не способных «держать 
в голове» такую мысль. Нужны были более простые и непосредственные 
стимулы, чтобы заставить организмы искать новые знания. По нашей ги- 
потезе, Природа нашла очень изящное решение, устроив нервную систему 
так, что ей, по-видимому, энергетически выгодно получать новые знания. 
Фокус, придуманный Природой, состоит в следующем. Разность потенциа- 
лов в нервном волокне в отсутствии импульсации активно поддерживается 
ионными насосами на уровне около —70 мВ (рис. 2.5). И для поддержания 
этого уровня, отражающего отсутствие нервных импульсов, т.е. отсутствие 
сигналов, отсутствие информации, организму приходится тратить энергию, 
которая потребляется ионными насосами. Во время прохождения нервного 
импульса наступает деполяризация, разность потенциалов сбрасывается до 
нуля и затем кратковременно меняется на противоположную до величины 
примерно +40 мВ. Тем самым, при прохождении нервного импульса потреб- 
ление энергии на поддержание работы насосов существенно снижается. Это 
можно видеть из сравнения закрашенных площадей на графике нервного 
импульса (рис. 2.5): работа, которая совершается в единицу времени (напри- 
мер, за первые 2 мс на графике) на поддержание напряжения в отсутствие 
импульса заметно больше, чем работа, совершаемая во время прохождения 
имипульса (следующие 2 мс). Организму просто энергетически выгодно по- 
лучать нервные импульсы — нервная импульсация должна снижать расход 
энергии в организме (это следовало бы проверить экспериментально) и орга- 
низм должен стремиться к получению нервных импульсов. Как же он может 
получить их? Для того чтобы получить нервные импульсы, организму надо 
задействовать рецепторы. Поэтому организм постоянно стремится к новым 
впечатлениям, он старается сделать так, чтобы его рецепторы работали — 
получали раздражения из среды, это энергетически выгодно организму. Ор- 
ганизму так же приятно получать новые впечатления, как приятно отды- 
хать от тяжелой работы, потому что находиться в условии отсутствия впе- 
чатлений, «сенсорного голода» — это означает необходимость совершения 
тяжелой работы по поддержанию в своих нервных волокнах постоянного 
напряжения (поляризации), равного —70 мВ. Лозунг «хлеба и зрелищ!» имеет 
вполне физическое обоснование. Новые впечатления приводят к деполяриза- 
ции нервных клеток, разрядке напряжения, нервные клетки отдыхают, орга- 
низму приятно, а нервная система тем самым получает новые знания, чем 
и удовлетворяет своей целевой функции накопления знаний. Можно легко 
видеть, с какой радостью все живые организмы получают новые впечат- 
ления, активно стремятся к ним (здесь мы не говорим об эмоциональных 
оценках распознаваемых образов, которые могут быть и отрицательными). 
Если бы нервный импульс реализовался по-другому, например, в спокойном 
состоянии разность потенциалов внутри и снаружи нервной клетки и нерв- 
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ного волокна была бы равна нулю, а для прохождения нервного импульса 
требовалось бы создать напряжение, то организму энергетически было бы 
невыгодно создавать эти импульсы, ему было бы лень делать это, в резуль- 
тате организм не стремился бы к новым впечатлениям и, как следствие, 
не получал бы новой информации, новых знаний, не было бы приспособ- 
ления и развития. Сказанное определяет мотивацию к накоплению знаний 
на микроуровне, однако она легко переводится в мотивацию и на уровне 
образов, если в организме есть датчики расхода энергии, что, скорее всего, 
имеет место. 

Вернемся к мотивациям на уровне образов. Если строить объяснения актив- 
ного поведения организмов на заранее заданных потребностях и мотивациях, 
то нельзя будет объяснить ни случаев суицида, ни стремления к удовлетворе- 
нию каких-то потребностей, совершенно непонятных посторонним. Потому что 
невозможно предусмотреть в организме столько потребностей, сколько может 
быть сформировано образов. 

Для построения автономной адаптивной управляющей системы, кото- 
рая имитировала бы естественную нервную систему, совершенно необходимо 
предусмотреть в ее составе подсистему, играющую роль аппарата эмоций. Хо- 
телось бы подчеркнуть крайне важную роль подсистемы эмоций. Ведь именно 
она является «движущей силой» внутренней активности организма, именно 
она определяет результат принятия решений, именно она является «учите- 
лем» управляющей системы при ее обучении (некоторых функций подсистемы 
эмоций мы еще не коснулись). Поэтому мы полагаем, что подсистема, эмоций 
и является тем системообразующим фактором, о необходимости которого го- 
ворил П. К. Анохин в своих работах по функциональным системам. П. К. Ано- 
хин предлагал на эту роль «полезный приспособительный результат», но мы 
полагаем, что это почетное место должна занять подсистема эмоций. 

Итак, в «черной комнате» УС, где нас ждет демон, расположим еще одну 
подсистему — подсистему эмоций. 


Принятие решений 


Наш демон, благодаря аппарату эмоций теперь небезразлично относится к та- 
ким информационным объектам, как образы, и у него есть постоянная мо- 
тивация — демон стремится к повышению «общей текущей эмоциональной 
оценки». 

Выше мы описали уже все компоненты, необходимые демону для принятия 
решений: подсистему формирования и распознавания образов (ФРО), понятия 
сформированных образов, распознанных образов, «Память образов», «Память 
распознанных образов», понятия знаний и подсистему «База Знаний», поня- 
тия эмоциональных оценок образов и общей эмоциональной оценки текущего 
состояния ОУ, подсистему эмоций, целевые функции и понятие мотивации. 

Алгоритм принятия решений теперь становится очевиден. Он состоит 
в следующем. Демон смотрит, какие образы распознаны подсистемой ФРО 
в данный момент. Затем в своей «Базе Знаний» ищет те знания — записи 
вида (3), в которых поле «Условие» соответствует распознанным образам. 
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Это те знания, которые применимы в текущих условиях; они указывают, 
какие действия демон может совершить в текущей ситуации, и что из этого 
может получиться — какие образы будут распознаны, какие будут вытеснены. 
Эмоциональные оценки образов демон уже знает, они записаны в его «Памяти 
образов». Демон берет калькулятор и для каждого действия подсчитывает, 
какие эмоциональные оценки он приобретет, а какие потеряет вместе с вы- 
званными и вытесненными образами. Например, пусть «действие» Х обещает 
вызвать распознавание образа А с оценкой «—3» и вызвать вытеснение об- 
раза В с оценкой «+4», значит, в сумме получится выигрыш 


+ < — 3» — «+4» = « – 7». 


Пусть также «действие» У обещает вытеснить тот же самый образ В, но вы- 
теснить еще и образ С с оценкой «—2», что в сумме даст 


—«-+ 4 – « – 2 = « – 2». 


Если в «Базе Знаний» в текущих условиях не нашлось других вариантов 
действий, то демон, конечно, предпочтет выбрать «действие» Ү, так как оно 
нанесет меньше ущерба в текущих условиях. В данном случае демон был 
поставлен перед выбором из плохого и еще более плохого, но, руководствуясь 
своей мотивацией, выбрал лучший из этих вариантов, хотя ему и не удалось 
поднять свою общую оценку эмоционального состояния. Что ж, вполне жиз- 
ненная ситуация. 

Совершив процедуру принятия решений, демон отправляет номер выбран- 
ного «действия» исполняющим устройствам. Но вспомним, что под «дей- 
ствием» мы понимали некоторое множество кнопок на командном пульте, 
которые абсолютно равноценны для демона по их последствиям, согласно 
«Базе Знаний», накопленной демоном. Например, пусть выбранное демоном 
«действие» У означает, что демон может нажать любую, но только одну 
кнопку из множества {3, 4, 28, 46}. Демон должен выбрать одну из них без 
какой-либо информации, определяющей предпочтение. Демон наугад выби- 
рает кнопку 28 и нажимает ее. После этого поворачивается к экрану и наблю- 
дает, что, действительно, образы В и С исчезают с экрана — вытесняются. 
Соответственно реагирует эмоциональная оценка — она немного опускается, 
но демон понимает, что выбери он другое из известных ему «действий», эмоция 
опустилась бы еще ниже. 

Здесь у читателей может возникнуть множество вопросов, на часть из кото- 
рых мы ответим ниже, когда будем подробно разбирать эти алгоритмы. Но сей- 
час необходимо отметить одну важную деталь. Мы заметили, что «действие» У 
демон («управляющая система») выбрал детерминированно, по указанному 
нами алгоритму, а выбор конкретной кнопки из альтернативного их множества, 
{3,4, 28, 46} демон осуществил случайным способом. Для того чтобы УС могла 
делать и эту процедуру автоматически, необходимо в состав УС ввести еще 
одну подсистему — генератор случайного выбора, что-то вроде известного 
программистам генератора, случайных чисел. Такое устройство по нашей тер- 
минологии является «истоком», так как его выходные воздействия не должны 
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быть функцией от каких-то входных данных. Итак, мы вводим в состав УС 
еще одну подсистему «Исток», которую подключаем к подсистеме принятия 
решений. 

Теперь попросим читателя посмотреть на процедуру принятия решений 
вот с какой точки зрения. Формально, мы имеем полное множество пронуме- 
рованных кнопок, представленных на пульте. Вначале все кнопки были для 
нас непонятны, мы не знали, к чему приводит нажатие на них, т.е. эти кнопки 
были для нас «неизвестными». Когда нам удалось начать формировать «Базу 
Знаний», часть из этих кнопок вошла в некоторые множества — «действия». 
Нам стали понятны хотя бы некоторые последствия нажатия на эти кнопки 
(они влияют на некоторые известные нам образы). В этом смысле они стали 
для нас «известными». Пометим «известные» кнопки краской. Чем больше 
становится «База Знаний», тем больше становится помеченных кнопок. Проце- 
дура принятия решений складывается из двух компонент: детерминированной 
и случайной. «Действие» управляющая система выбирает детерминированно, 
по описанному выше алгоритму. Но «действие» есть некоторое множество 
альтернативных кнопок, и из этого множества далее надо произвести уже 
случайный выбор. 

По мере наполнения «Базы Знаний» все больше кнопок разбирается по 
различным действиям и все меньше остается кнопок, не помеченных краской. 
Неопределенность (энтропия) ситуации для демона и для УС становится все 
меньше, если энтропию считать относительно числа всех кнопок — действий. 

Итак, алгоритм принятия решений, которым пользуется демон, состоит 
в следующих шагах. 


Шаг 1. Формирование образов. Посмотри на выходы от датчиков и сделай 
соответствующие изменения статистических счетчиков в подсистеме 
ФРО. Если какие-то счетчики в подсистеме ФРО достигли своих по- 
роговых значений — значит, сформировались новые образы. Запиши 
их номера в «Память образов» и назначь им эмоциональные оценки 
«ни то, ни се» (это шаг в сторону цели «накопление знаний»). 


Шаг 2. Распознавание образов. Сравни показания датчиков с «Памятью 
образов» — не видны ли прообразы уже сформированных образов. 
Если да, то выдавай на выход подсистемы ФРО сигналы о распо- 
знавании этих образов. 


Шаг 3. Отделение актуальных знаний. Посмотри в свою «Базу Знаний», 
нет ли в ней знаний (записей в форме (3)), в которых поле «Условие» 
соответствует распознанным сейчас образам. Выпиши все такие за- 
писи. Получившийся список определяет множество альтернативных 
«действий», которые ты можешь совершить в текущей ситуации и из 
которых можешь выбрать только одно. 


Шаг 4. (Этот шаг подробнее будет рассмотрен немного ниже.) Здесь оцени- 
вается время, которое можно потратитъ на принятие решения 
и рассчитывается число анализируемых образов-следствий. 


Шаг 5. Расчет прогнозируемых изменений эмоциональных оценок для аль- 
тернативныт действий. Возьми первую или очередную запись 


2.11. Состав и функции подсистем адаптивной системы управления 83 


из списка альтернативных действий и раскрой поле «результат», 
в котором записано, какие именно образы будут распознаны в ре- 
зультате совершения данного действия, а какие образы будут вы- 
теснены. Возьми из «Памяти образов» эмоциональные оценки этих 
образов и найди алгебраическую сумму этих оценок, прибавляя 
оценки тех образов, которые будут распознаны, и вычитая оценки 
тех образов, которые будут вытеснены. Полученная сумма будет яв- 
ляться «оценкой (данного) действия». Вычисли «оценки действий» 
для всего списка альтернативных действий. 


Шаг 6. Нахождение оптимального действия. Выбери действие, имеющее 
максимальную «оценку действия», и дай исполнительным органам 
команду на его выполнение. Это лучшее, что ты можешь сделать 
в текущих условиях для того, чтобы к следующему шагу макси- 
мально поднять свою «общую оценку эмоционального состояния». 


Шаг 7. Переходи к шагу 1. 


Другими словами, для выбора лучшего действия надо оценить прогнози- 
руемые (обещаемые) ими результаты — определить, которое из действий даст 
большее увеличение общей эмоциональной оценки состояния ОУ. Для этого 
следует рассчитать «оценку действия» для каждого из действий из списка 
альтернативных действий, который отделяется в Базе Знаний множеством 
распознанных образов, и эта оценка равна сумме оценок распознаваемых 
и вытесняемых образов, где оценка суммируется, если образ распознается, 
и вычитается, если образ вытесняется данным действием. 

Например, пусть распознан образ купюры $100 в руках незнакомого чело- 
века. В Базе Знаний для этого образа (образ 2) найдено всего две записи: 


а) Образ х(Н) — действие 1 ($) — (образ р, образ а) (з), 


где «действие 1» означает схватить купюру, «образ р» есть образ крупной 
неприятности с эмоциональной оценкой «очень плохо», а «образ 4» есть образ 
получения прибыли в $100 с эмоциональной оценкой «хорошо». 

Вторая запись имеет вид 


Ъ) Образ 2(11) — действие 2 (15) — (образ т) (&), 


где «действие 2» означает ничего не делать, а «образ т» есть образ сохранения 
своей репутации, имеющий эмоциональную оценку «очень хорошо». 

Рассчитываем «оценку действия» 1: она равна «очень плохо» плюс «хо- 
рошо», что в сумме даст «неважно». Рассчитываем «оценку действия» 2: она 
равна «очень хорошо». Поскольку «очень хорошо» лучше, чем «неважно», то 
выбираем действие 2 — ничего не делать. 


Время принятия решений 


Мы видим, что процедура принятия решений заставляет демона производить 
довольно много операций и расчетов, объем которых сильно возрастает при 
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большом числе сформированных образов и большой «Базе Знаний». Чтобы 
представить себе объем вычислений, попробуйте оценить на своем опыте, 
сколько образов вы распознаете в текущий момент, и каково множество тех 
действий, которые Вы можете принципиально совершить в текущей обста- 
новке? Конечно, и образов очень много, и число возможных действий очень 
велико. Возможно, что сейчас, глядя вокруг себя, вы распознаете, например, 
дома, окна, двери, улицу, деревья, машины, людей, киоски, облака, солнце, 
птиц, самолет и т. д., и т. д. вы могли бы сейчас: сесть, лечь, открыть дверь, 
побежать к людям, остановить проезжающую машину, закричать, запеть, 
сказать много чего, сделать руками множество движений и т. д., ит. д. Од- 
нако есть ощущение, что, принимая решения на практике, мы выбираем 
не из такого уж и большого множества альтернативных действий. (Автора 
поразило однажды, когда он прочитал в какой-то книге, что при попытке 
выяснить, из какого же числа вариантов выбирает свое решение военачальник 
на поле боя, выяснилось, что в большинстве случаев выбор происходит из... 
одного варианта — первого пришедшего в голову. Конечно, здесь срабатывают 
большой опыт и знания, которые автоматически подсказывают сразу готовое 
решение.) 

Число альтернативных вариантов, из которых происходит выбор, огра- 
ничивается прежде всего, по-видимому, временем, отведенным на принятие 
решения. Внутри нас как будто все время работают часы, показывающие, 
сколько времени нам отведено на принятие очередного решения. И этого 
времени всегда очень мало, его явно не хватает для того, чтобы принять 
вполне взвешенное решение. Что же это за часы, идущие в нас? Откуда они 
знают, сколько времени мы можем думать над принятием данного конкретного 
решения, и когда будет уже поздно? Нам представляется, что эти внутренние 
часы работают в некоторой функциональной зависимости от... показаний 
аппарата эмоций. Действительно, дело представляется так, что чем ниже теку- 
щая эмоциональная оценка, и чем быстрее она ухудшается, тем быстрее надо 
принимать решение. И наоборот, чем лучше наше эмоциональное состояние 
или чем быстрее оно улучшается, тем больше времени мы можем потратить 
на обдумывание решения. Другими словами, темп принятия нами решений 
находится в некоторой функциональной зависимости от величины текущего 
эмоционального состояния и его производной. 

Если мы положим, что при принятии решений основное время тратится 
на расчет «оценок действий», а именно — на суммирование эмоциональных 
оценок образов, на которые влияет действие, и что обсчет одного образа 
занимает конечное время, то можно сказать, что наши внутренние «часы» 
показывают число образов, которые мы можем обработать при принятии 
решений. 

Для того чтобы смоделировать такие внутренние часы, введем в со- 
став УС подсистему «Определение времени принятия решения», которая 
будет в функциональной зависимости от величины «общей эмоциональной 
оценки текущего состояния ОУ» 5(#) и ее 1-й производной 45(1) /# рассчи- 
тывать число К образов, которые можно обработать при принятии решения 
на такте $. 
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45(#) /а 


Рис. 2.14. Примерный вид зависимости времени, отведенного на принятие решений 
(глубины просмотра «Базы Знаний»), от значения общего текущего эмоционального 
состояния и его производной 


Функциональная зависимость 


ц) = к (8, 20 (4) 


может иметь графический вид, показанный на рис. 2.14. 

Функция К определена на пространстве как положительных, так и отри- 
цательных значений эмоциональной оценки и ее производной. Однако при 
некоторых отрицательных их значениях она превращается в нуль. Это соответ- 
ствует той ситуации в жизни, когда ситуация так плоха или так быстро ухуд- 
шается, что нервная система уже отказывается принимать решения и впадает 
в заторможенное состояние — в обморок. По мере увеличения эмоциональной 
оценки или ее производной функция К монотонно возрастает до некоторой ве- 
личины. Однако при дальнейшем росте аргументов возможно и немонотонное 
поведение функции. Например, у некоторых субъектов при больших значениях 
аргумента она может начинать спадать, такие субъекты теряют способность 
принимать решения в очень благополучной обстановке. Нам представляется, 
что вид этой функции определяет темперамент субъекта. 

Осталось только сказать, что когда для принятия решения нам разрешено 
проанализировать только К образов (их ожидаемую реакцию на предполага- 
емое действие), то вполне разумно будет рассмотреть только те & образов, 
которые имеют самые низкие или самые высокие эмоциональные оценки, 
т.е. самые высокие по абсолютной величине оценки. Именно поэтому, хотя 
мы и распознаем в текущий момент, например 150 образов, но при принятии 
решения учитываем, например, только 2 образа, (если нам не разрешено учесть 
больше) с самыми плохими или с самыми хорошими оценками, остальные 
образы остаются неучтенными. Тем самым, в выбранном действии мы пла- 
нируем, предусматриваем реакцию только этих двух образов, а все остальные 
образы изменятся непредсказуемо для нас, т. е. случайно. Например, если мы 
переходим улицу в спокойной обстановке, то нам разрешено учесть много 
образов, и мы так тщательно выберем свои действия, что учтем и красоту своей 


86 Глава 2. Анализ естественной системы управления 


походки и изящество позы, и как сидит шляпа, и как на нас посмотрит стоящая 
невдалеке девушка. Но если мы распознали очень плохой образ наезжающего 
на нас грузовика, то функция К разрешает нам учесть только несколько 
самых важных образов, и мы выбираем первое подходящее действие, которое 
спасет нам жизнь, но при этом вызовет неконтролируемую реакцию остальных 
образов — мы прыгаем в сторону, теряя шляпу, и, попадая в лужу, обрызгиваем 
девушку. 

Рассмотренная подсистема, определения времени принятия решений явля- 
ется очень важной, и мы еще будем к ней возвращаться ниже. 


Схема управляющей системы 


Итак, теперь, когда мы вкратце обозначили все необходимые подсистемы УС 
и их функции, можно изобразить в общем виде структуру управляющей 
системы. На рис. 2.15 показаны функциональные подсистемы УС и состав всей 
системы «среда — ОУ — УС». 

На рис. 2.16 показаны подразделы памяти УС, о необходимости которых 
мы говорили, описывая ее работу. 

На этом этапе мы можем отпустить демона из «черной комнаты» УС, так 
как она больше не является «черной», а скорее — «серой», мы определили 
главные ее подсистемы и принцип их работы. Теперь мы можем смоделировать 
работу нервной системы, во всяком случае, в рамках той модели, которую мы 
строили. Насколько эта модель справедлива — поручим разбираться физио- 
логам, но мы строили эту модель, вынужденно следуя шаг за шагом из тех 
отмеченных исходных условий, которые мы наблюдаем у нервных систем. 


Среда Ч 


Блок Формирование Аппарат 
датчиков и распознавание |—3] эмоций 


образов 


Формирование 
Базы 
Знаний 


Определение 
времени 


Исполняющий Принятие принятия 
орган решений решения 


Рис. 2.15. Структура функциональных подсистем управляющей 
системы ААУ в составе системы «среда — ОУ — УС» 
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Рис. 2.16. Разделы памяти управляющей системы 
и обслуживаемые ими подсистемы 


В заключение этого раздела коротко опишем принцип действия построен- 
ной модели нервной системы, опираясь на приведенные схемы. 


® Получая от датчиков входные данные в бинарном виде, подсистема ФРО 
статистическим методом и опираясь на априорную информацию, «Па- 
мять образов» и «Память распознанных образов», постоянно в «фоновом 
режиме» решает задачу формирования новых образов (задача авто- 
матической классификации без учителя). Новые образы записываются 
в «Память образов». 

® Одновременно с этим та же подсистема ФРО строго в режиме «ре- 
ального времени» решает задачу распознавания образов во входных 
данных, используя также «Память образов» и «Память распознанных 
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образов». Распознанные в текущий момент образы индицируются на вы- 
ходе подсистемы ФРО и записываются в стек «Памяти распознанных 
образов». 

Подсистема эмоций определяет текущую «эмоциональную оценку об- 
щего состояния ОУ» 5(#), пользуясь списком распознанных образов и их 
эмоциональными оценками, хранящимися в «Памяти эмоциональных 
оценок образов». Полученная оценка индицируется, а также записы- 
вается в стек «Памяти текущих эмоциональных оценок общего состо- 
яния ОУ». 

Одновременно с этим «Подсистема эмоций» некоторым статистическим 
методом находит эмоциональные оценки новым сформированным обра- 
зам, используя «Память распознанных образов» и «Память текущих 
эмоциональных оценок общего состояния ОУ». Найденные оценки за- 
писываются в «Память эмоциональных оценок образов». 

На основании архивного анализа «Памяти образов», «Памяти распо- 
знанных образов», «Памяти выбранных действий» и «Базы Знаний», 
подсистема формирования Базы Знаний выявляет новые статистически 
достоверные знания о причинно-следственных связях образов-условий, 
действий и образов-результатов, которые отражают функциональные 
свойства данной конкретной системы «среда — ОУ — УС». Эти знания 
являются одновременно эмпирическими и выводными. Новые знания 
помещаются в память «База Знаний» в определенной структуре, при- 
вязывающей их к ранее найденным знаниям. 

Подсистема эмоций рассчитывает время, допустимое для принятия ре- 
шений в текущих условиях (количество образов, которые можно успеть 
учесть — глубину просмотра «Базы Знаний»), используя текущую эмо- 
циональную оценку и ее производную, и передает результат в подсистему 
принятия решений. 

Подсистема принятия решений, получив сведения о распознанных в те- 
кущий момент образах, анализирует «Базу Знаний» и отделяет в ней 
те разделы знаний, которые действительны в текущей ситуации (со- 
держащие альтернативные действия, допустимые в текущих условиях). 
В отделенных разделах знаний отыскивается действие, которое обе- 
щает дать результат, максимизирующий будущую прибавку в текущей 
эмоциональной оценке общего состояния ОУ. При этом учитывается 
допустимая глубина просмотра «Базы Знаний». При расчете «оценок 
действий» используется кратковременная «Память оценок действий». 
Принятое решение сообщается исполнительным органам и одновременно 
запоминается для последующего анализа в «Памяти выбранных дей- 
ствий». 

От исполнителей принимается информация о действительно совершен- 
ных ими действиях (которая в принципе может отличаться от выбран- 
ных действий) и тоже запоминается в «Памяти совершенных действий», 
которая анализируется подсистемой формирования «Базы Знаний». 


После этого цикл управления повторяется. 


2.11. Состав и функции подсистем адаптивной системы управления 89 


Отметим также, что все операции, связанные с анализом архивных записей 
в памяти, имеющие целью извлечение закономерностей — т.е. знаний, мо- 
гут производиться управляющей системой параллельно с основным циклом 
оперативного управления и в некотором смысле независимо от него. На наш 
взгляд, что-то подобное, возможно, происходит в параллельной работе полу- 
шарий мозга, когда правое полушарие постоянно, но в «фоновом режиме» 
ищет закономерности в памяти, а левое полушарие в это же время занято 
оперативным управлением строго в «реальном времени». 


Первый механизм принятия решений 


Хотя мы описали схему и основной принцип действия управляющей системы 
(УС), хотелось бы еще раз обратить внимание на такие автоматические свой- 
ства рассматриваемой УС, как: 


а) способность уменьшать со временем неопределенность своих знаний; 

б) делать управление более точным; 

в) развивать сам способ принятия решений. 

Выше мы писали о том, что управляющая система контролирует инфор- 
мацию не от всех датчиков. Иначе говоря, не все то, что находится в поле 
зрения датчиков, попадает в «сферу сознания» нервной системы. Входная 
информация только постепенно, по мере обучения УС, попадает в ее «Базу 
Знаний» и начинает контролироваться УС в процессе принятия решений. 

Для того чтобы лучше объяснить эти свойства, покажем процесс управле- 
ния в несколько метафорической форме, которая не очень строга математи- 
чески, но позволит нам взглянуть на процесс управления системы ААУ под 
нужным углом зрения. 

Представим себе, что среда, лежащая за пределами УС (см. рис. 2.9), 
обладает функциональными свойствами, которых мы не знаем. УС может 
воздействовать на среду с помощью своих выходов и наблюдать отклик среды 
через свои входы. 

Текущие значения параметров Х1, Хо,..., Хь..., описывающих состояние 
среды, можно показать графически, например так, как на рис. 2.17. 


х х Хз Х № Хх Жь 


-3 91 т | ® Т 


Рис. 2.17. Текущие значения параметров, описывающих состояние среды. 
Показаны допустимые для ОУ границы значений параметров 
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Пусть в некоторый начальный момент в «сфере сознания» УС находится 
только один параметр Х1, и для ОУ допустимыми являются только те его 
значения, которые лежат в указанном на рисунке диапазоне. О существовании 
других параметров УС пока «не знает», так как еще не сформировала их об- 
разы. Пусть УС сформировала шесть образов Я 1, (25,..., 6, соответствующих 
некоторым различимым ею интервалам возможных значений параметра Х}, 
и присвоила этим образам эмоциональные оценки «—3», «—2», «1», «1», «—2», 
«—3» соответственно. Имеется образ 0 «выхода за допустимые пределы» 
с крайне плохой оценкой «—4». 

Пусть УС эмпирически нашла следующую «Базу Знаний» (рис. 2.18). 


База Образы условия 
знаний 
9; 95 03 97 05 0; 
$ с У. 92(—2) 93 (1) 4 (1) Я5(—2) | 9(—3) | 9(—4) 
оо 
2с 
ач % | 90(-4) | 9.(-3) | 9(-2) | 93) | 94@) | 95-2) 


Рис. 2.18. Элементарная «База Знаний» в табличной форме, 
учитывающая возможности управления одним параметром 


«База Знаний» на этом рисунке означает следующее. УС «на своем 
опыте поняла», что если она в некоторый момент времени распознает об- 
раз 9; (см. столбец «Образы условия») и после этого совершит действие У, 
(см. строку «Возможные действия»), то в результате ситуация в среде из- 
менится так, что УС распознает образ 05 с эмоциональной оценкой (—2); 
а если УС совершит действие У, то в результате получит распознавание 
образа Оо с эмоциональной оценкой (—4). Если же в некоторый момент будет 
распознан образ 95, то действие У, приведет к распознаванию образа 9з с 
эмоциональной оценкой (1), а действие Ур приведет к распознаванию образа (21 
с эмоциональной оценкой (—3), и т. д. Тем самым, оказавшись в ситуации, 
которая распознается УС в виде «образа условия» 0, УС может выбирать для 
совершения такое действие, которое приведет к переходу системы в состояние 
с наилучшей из возможных в этом состоянии эмоциональных оценок. Здесь 
речь шла об управлении только параметром Хі. 

Такая таблица в сжатой форме представляет набор импликаций вида 


(О: (&УЕ+ т) = 92(Е+2) > (-2), 
означающих, что при распознавании образа, 01 (2) и совершении действия 


У,(Е- 1) получим в результате распознавании образа (+ 2) с его эмоци- 
ональной оценкой (—2). 
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Основную информацию такой «Базы Знаний», описывающую возможности 
управляющей системы по управлению параметром Ху, можно также предстал 
вить следующей табличкой (рис. 2.19), в которой АХ = 1 встроке Ү, означает, 
что действие У, вызывает увеличение параметра Ху на величину АХ}, значе- 
ние АХ! = -1 в строке У означает, что действие У вызывает уменьшение 
параметра Х1 на величину А Ху, а запись А Ху = А в строке Үл означает, 
что действие Ул не оказывает никакого влияния (с точки зрения текущих 
знаний УС) на параметр Хі. 


АХ! 
У 1 
У —1 
Ул Л 


Рис. 2.19. Возможности управляющей системы по управлению параметром Хі 
среды. Через Л обозначено отсутствие влияния действия на параметр 


Когда УС начинает управлять средой с помощью одного параметра, то она, 
возможно, добьется успеха и будет поддерживать параметр Х1 в допустимых 
пределах, пользуясь «действиями» У, и %. Однако мы помним, что среда 
на самом деле описывается не одним, а многими параметрами, и «действия» 
У, и У могут влиять на другие параметры, о чем УС пока не знает. Выбирая, 
например, «действие» Ү, с целью увеличить значение параметра Ху, УС доби- 
вается желаемого результата, но влияние этого действия на другие параметры 
для управляющей системы остается неконтролируемым, т. е. они происходят 
случайным для УС способом. 

Например, параметр Хэ в результате совершения действия может либо 
увеличиться, либо уменьшиться. Если бы УС контролировала оба параметра, 
то ее возможности по управлению описывались бы таблицей (рис. 2.20), в ко- 
торой фигурировало не 2, а 4 варианта действий, которые учитывали бы 
все возможные изменения двух параметров в результате этих действий. Но 
сейчас УС пользуется только двумя вариантами действий. Поэтому когда УС 
выбирает, например, действие Ү,, на самом деле реализуется одно из дей- 
ствий У, или Уд. Тем самым, среда получает детерминированное для УС 


действия | дейтыия| АХ | АХ 
У 1 1 

У У: 1 —1 
у. —1 1 

У У; —1 —1 
Ул Ул Л Л 


Рис. 2.20. Управляющая система, переходит 
к управлению двумя параметрами 
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изменение параметра Ху и случайное изменение параметра Хз. Если при 
выборе «действия» У, действия У, и Уд реализуются с примерно равной 
вероятностью, то параметр Хэ может оставаться в допустимых пределах в силу 
благоприятных случайных обстоятельств. Если же выбор одного из действий 
У. или Уд становится неравновероятным, то параметр Хэ начнет меняться 
неслучайным способом и когда-либо его значение приблизится к допустимой 
для ОУ границе. 

Вспомним теперь про аппарат эмоций, работа которого зависит от по- 
казаний датчиков более непосредственно, чем «сознание» УС, т.е. ее «База 
Знаний» и подсистема принятия решений. Если «неконтролируемый» созна- 
нием параметр Хэ приблизится к допустимой границе, то аппарат эмоций 
почувствует это и «эмоциональная оценка общего состояния ОУ» упадет. 
Возникнет ситуация, когда контролируемый параметр находится в норме, 
но общая эмоциональная оценка говорит о том, что с объектом управления 
что-то не в порядке. Эта ситуация неприятна для нервной системы, она начи- 
нает искать причину низкого значения эмоции. Возникшая ситуация может 
закончиться либо обнаружением этой причины и введением ее в область 
«сознания» (формируются и вводятся в «Память образов» и в «Базу Знаний» 
новые образы, связанные с параметром Хэ), либо причина не обнаруживается, 
и тогда судьба организма, зависит от случая. 

Когда образы, описывающие новый параметр, сформированы и введены 
в память, УС начинает искать действия, которые будут влиять на эти образы. 
Если такие действия (увеличивающие и уменьшающие параметр) находятся 
и записываются в «Базу Знаний», то УС получает возможность управлять 
этим новым параметром и вывести его из области недопустимых значений. 
Теперь База Знаний, имевшая ранее вид, показанный на рис. 2.19, расшири- 
лась и выглядит так, как на рис. 2.20. 

Проиллюстрируем это на примере. Пусть Ху — запас пищи у некоторого 
животного, Хэ — количество белков в пище, У, означает действие «есть 
пищу», У. — «есть животную пищу, богатую белками», а Ул — «есть рас- 
тительную пищу, богатую углеводами». Не контролируя Хз, наше животное 
ест неразборчиво, не различая белковую и углеводную пищу. Если животное, 
решаясь на поиск пищи (выбирая «действие» Ү,), совершает действия У’ и Ул 
с примерно равной вероятностью, то количество белков может поддерживаться 
на допустимом уровне. Если же животное начинает по какой-либо причине 
отдавать предпочтение преимущественно углеводной пище, количество белков 
в его организме падает, что приводит в конечном счете к ухудшению теку- 
щей эмоциональной оценки. Если животное сумеет обнаружить зависимость 
текущей эмоциональной оценки от вида съеденной пищи, то тем самым оно 
начнет контролировать параметр Хо и введет его в свою Базу Знаний. Далее 
оно должно дифференцировать все возможные варианты добывания пищи, 
ранее составляющие «действие» Ү,, на два подмножества, соответствующих 
«действиям» Ү, и Уд, т.е. действиям, направленным на добывание отдельно 
белковой или углеводной пищи. Теперь поумневшее животное принимает ре- 
шения, контролируя уже два параметра, — количество пищи и наличие в ней 
белков, — например, принимает решение «есть пищу, богатую белками». 
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Пользуясь новой расширенной Базой Знаний, УС может теперь целена- 
правленно управлять двумя параметрами — Ху и Хо из их множества, по- 
казанного на рис. 2.17. Однако остальные параметры остаются неконтролиру- 
емыми управляющей системой и по-прежнему будут изменяться случайным 
для УС способом. Далее события могут развиваться аналогично по отноше- 
нию к какому-либо другому из неконтролируемых образов. Постепенно База 
Знаний будет расширяться, и все больше параметров будут контролироваться 
управляющей системой, однако всегда будут оставаться и параметры, которые 
остаются вне «сознания» управляющей системы. 

Маловероятно, однако, что в реальном мире можно найти действия, кото- 
рые могли бы оказывать все формально возможные воздействия на контроли- 
руемые параметры. Если свойства среды подчинены некоторым закономерно- 
стям, то это и означает, что имеют место ограничения, накладываемые на дей- 
ствия, которыми можно влиять на эту среду (например, нет действий, которые 
позволили бы одновременно поднять и давление и объем газа в изотермическом 
процессе, или нет действий, которые позволили бы одновременно и капитал 
нажить, и честь соблюсти, и т. п.). Другими словами, если представлять Базу 
Знаний таблицей (как на рис. 2.20), имеющей много столбцов и строк, то в силу 
указанных причин не все клетки таблицы будут заполнены. Реальная База 
Знаний всегда будет содержать лишь часть строк от полной таблицы из п 
параметров и 2” строк. 

Кроме того, действие может вызвать реакцию не всех, но только части 
параметров, не влияя на другие параметры, т. е. в некоторых клетках таблицы 
Базы Знаний могут быть записаны не только «1» или «—1», но и «ж», что будет 
означать неопределенность. Очевидно также, что реакции «1» или «—1» могут 
иметь не обязательно детерминированный, но и вероятностный характер, 
поэтому в клетке Базы Знаний может быть записана и вероятность указанной 
реакции параметра. 

Итак, эмпирически найденные управляющей системой возможности по 
управлению системой «среда — объект управления» могут быть представлены 
таблицей, пример которой показан на рис. 2.21. 


АХ! АХ. А Хз кея АХ; а АХ» 
У 1 1 * 1 ж 
Уз 1 * 1 ж —1 
У; * —1 * ж —1 
У ж ж ж абаа — 1 е ж 


Рис. 2.21. Пример таблицы, описывающей возможности 
управления параметрами системы 
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База Образы, определяющие условия применимости действий 
знаний 

С:({9:}) | С({9:)) е: С;9:р) 5 См({9:)) 

У Е11;911 | А12; 912 Е Ву; 913 ... В1,м;Фф,м 

Үз | Рол; фа | 2,2; 42.2 е Нэ,3; 42,3 г“ Нэ,м;Ф,м 
к 
= 
[а] 
Га 
о 
< 
Ф 
| 
Ф 
2 
Е: 

8 У, Вкл; кл | Вь,2; 4.2 ... Вь, 1; 9,3 98 Крм; 9м 
8 
т) 

Ух | Им; 9м | Емо; 9% ... Ем); 4,3 Е Вмм;амм 


Рис. 2.22. «База Знаний» в табличной форме 


Для представления этих возможностей в памяти управляющей системы 
в терминах образов, действий и оценок можно использовать Базу Знаний 
в виде прямоугольной таблицы (рис. 2.22). 

Каждый столбец БЗ содержит знания, которые справедливы (действи- 
тельны) только при выполнении условий, записанных в заголовке этого 
столбца. Другими словами, этот столбец можно использовать для принятия 
решения, если выполняется условие, записанное в его заголовке. Это условие, 
которое мы обозначили через С;({0;}), представляет собой некоторое логи- 
ческое выражение, аргументами которого являются выходы системы распо- 
знавания, указывающие, какие образы распознаны, а какие не распознаны 
в текущий момент (0; = «Истина», если образ ©; распознан, и О; = «Ложь», 
если образ 9; не распознан). Если условие выполняется, оно равно «Истина», 


если не выполняется, то оно равно «Ложь». Например, условие Сз({9;}) может 
иметь вид 


С3({0;}) = (О Л 95 л -03) У 04, 


что означает: «знания, записанные в столбце 3, справедливы, когда распознаны 
образы 9; и 95, и одновременно не распознан образ Оз, или когда распознан 
образ Од». Здесь Л означает логическую операцию И, У означает логическую 
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операцию «ИЛИ», а ~ означает логическое отрицание, как это принято в ма- 
тематической логике. 

Каждая строка таблицы БЗ соответствует одному из действий Ух, которые 
управляющая система может инициировать. 

В каждой клетке столбца, БЗ, для которого в текущий момент условие вы- 
полняется, записано, что следует ожидать при выполнении соответствующего 
действия Ух, именно — какие образы будут распознаны, а какие будут вы- 
теснены в результате совершения этого действия. Этот ожидаемый результат 
мы обозначили списком Кр ;, который просто перечисляет образы, которые 
будут распознаны и образы, которые будут вытеснены, при этом вызываемые 
образы помечены префиксом «+», а вытесняемые помечены префиксом «—». 
Например, запись 


Бъз = 91 + 02 + Әз 


означает, что в ситуациях, когда условие Сз({0;}) = «Истина», управляющая 
система может совершить действие Ү5, в результате чего последует вытеснение 
образа 1 и распознавание образов (25 и Оз. 

Например, пусть у вас есть электрический чайник «Вгаџп», и пусть 91 — 
это распознаваемый вами образ жажды; 05 — это образ наличия воды в чай- 
нике, вы его распознаете, глядя в прозрачное окошко чайника; Оз — это 
образ кипения воды, который вы распознаете, видя в окошке пузырящуюся 
воду; 04 — это образ пара, вырывающегося из носика чайника при кипении. 
Пусть среди всех действий, которые вы можете совершить, есть действие Уь, 
обозначающее «нажать на клавишу включения чайника», и в вашей БЗ уже 
есть запись 


Вз — —01 + 95 + 03. 


Тогда, если однажды вы распознали, что условие 
Сз(19;}) = (О л 95 л 9з) У 04, 


выполнено (= «Истина), т. е. вас мучит жажда, в чайнике есть вода и она 
не кипит, либо наблюдается пар, выходящий из носика чайника, то БЗ подска- 
зывает вам, что вы имеете возможность выполнить действие У5, т. е. нажать 
на клавишу включения чайника, в результате чего вы вскоре получите резуль- 
тат Б5з, т.е. вытесните образ жажды 0; и получите распознавание образов 02 
и Оз, т.е. в чайнике будет вода, и она будет кипеть. 

Подчеркнем, что действие Ух отнюдь не есть указание на то, что в текущих 
условиях следует непременно совершать именно это действие. В столбце БЗ 
содержатся указания на множество альтернативных действий, которые можно 
совершить в текущих условиях. Управляющая система должна выбрать одно 
из таких действий. Выбор производится на основе анализа максимального 
приращения эмоциональной оценки, которая может быть получена при со- 
вершении возможных действий. Это ожидаемое приращение оценивается пу- 
тем суммирования или вычитания эмоциональных оценок образов, которые 
будут распознаны или, соответственно, вытеснены в результате совершения 
действия. 
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Пусть в нашем примере образ жажды (0; имеет эмоциональную оценку 
«—7», образ 95 наличия воды в чайнике пусть имеет оценку «+1», образы 
кипения воды и пара, Оз и 04, пусть имеют оценку «0». Тогда в результате 
совершения действия У5 мы ожидаем получить приращение эмоциональной 
оценки на величину 


45,3 = —<—7» + «+1» + «0» = «+8», 


соответственно записи 


В5з = —01 + 0, + 03. 


Если в данном столбце БЗ найдется действие, которое обещает дать еще 
большее приращение эмоциональной оценки, то управляющей системе следует 
выбрать такое действие. При этом одновременно могут быть выполнены усло- 
вия в разных столбцах Базы Знаний. Следовательно, чтобы принять лучшее 
решение, следует проанализировать альтернативные действия из всех таких 
столбцов. 

Распознавая образы текущего состояния контролируемых параметров 
среды и объекта управления, учитывая эмоциональные оценки этих образов 
и пользуясь эмпирически найденной Базой Знаний, отражающей свойства 
конкретной системы, управляющая система теперь может принимать решения, 
имеющие целью улучшение текущего состояния объекта управления. Одновре- 
менно с этим, непосредственно в процессе управления происходит накопление 
статистики, что приводит к формированию новых образов, отражающих новые 
параметры системы. Формируются и новые знания о воздействиях на эти 
параметры. Таким образом, управляющая система будет становиться более 
«умной» и будет все более точно и аккуратно управлять системой. Описанный 
здесь алгоритм управления является базовым, основным, мы назовем его 
первым механизмом принятия решений. Из этого способа автоматически 
вытекают еще несколько механизмов управления. 


Второй механизм принятия решений 


Пусть в управляющей системе имеется «Память принятых решений», в ко- 
торую управляющая система постоянно записывает последовательность дей- 
ствий, выбранных ею в процессе управления с помощью первого механизма 
принятия решений. Получается временной ряд данных вида 


Ү.(#— 3), У #2), %@- 1), УК. 


В такой временной последовательности данных формальными методами 
можно находить различные регулярности. Например, периодичности. Так, 
из-за того, что База Знаний имеет ограничения, т.е. не всегда находятся 
действия, которые позволяют сразу достигать нужного результата, управляю- 
щей системе может понадобиться применять периодически чередующиеся дей- 
ствия. Можно указать множество примеров периодических действий, напри- 
мер, действия при работе слесарными инструментами, плавание на парусном 
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судне галсами и т. п. Задача выделения периодичностей во временной после- 
довательности данных, в том числе зашумленных, довольно хорошо решается 
математическими методами, которые, по сути, являются также методами 
распознавания образов. Указанную задачу мог бы решать и математически 
образованный демон, помещенный в управляющую систему. Для этого ему 
не нужна какая-либо дополнительная информация извне, кроме априорного 
указания на то, какого рода регулярности ему следует искать, ибо все мысли- 
мые регулярности демон проверить не смог бы. 

Пусть найдена некоторая последовательность периодически повторяю- 
щихся действий. Например, в ряду данных 


а) Үй, Үг, Ү;, Үз; Ү,, Ү;, У, ЕР Ү;, 
——__— 


Үү 


можно увидеть периодическую последовательность Ум = (Ул, У», У). Такую 
последовательность периодически повторяющихся действий можно назвать 
программой действий или моделью поведения. Будучи найденной, такая мо- 
дель поведения может быть продолжена автоматически. В этом случае ре- 
шение принимается уже не с помощью описанного выше первого механизма 
принятия решений, а посредством формального повторения однажды найден- 
ной модели поведения — последовательности действий. Так, например, модель 
поведения Ум может означать, например, последовательность действий, со- 
ставляющую способ плавания галсами на яхте. Капитан дает одну команду: 
«плыть галсами в заданном направлении», а далее его экипаж автоматиче- 
ски и периодически повторяет одну и ту же последовательность действий — 
вовремя перекладывает паруса, руль и т. д. 

Здесь надо учитывать также следующие соображения. Обнаруженная по- 
следовательность действий не всегда может быть полезной, иногда она может 
быть вредной, и тогда от нее следует отказаться. Решение о полезности, при- 
емлемости модели поведения, может быть принято на основании анализа пове- 
дения общей эмоциональной оценки на протяжении периода действия модели 
поведения. Если за время выполнения модели оценка в целом повышается, то 
модель можно принять к исполнению. Если эта оценка понижается, то модель 
надо отвергнуть. В этом состоит «правило останова» при пользовании моделью 
поведения: следует прекращать принятие решения по модели поведения, если 
общая эмоциональная оценка начинает падать. Последнее может произойти 
при распознавании некоего нового образа с отрицательной оценкой. 

Так, при выполнении циклического движения парусного судна галсами это 
движение можно повторять, пока расстояние до цели плавания уменьшается. 
Но если будет распознан неприятный образ, что судно прошло мимо цели 
и начинает от нее удаляться, принятие решений по данной модели следует 
прекратить. 

Другой пример: пусть мобильный робот попадает в угол и начинает со- 
вершать периодическую последовательность действий — топтаться на одном 
месте, не приближаясь к цели. Если при этом распознается образ, что цель 
не приближается, а также распознается образ уменьшения запаса топлива или 
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тому подобные неприятные образы, то в этом случае роботу следует отказаться 
от повторения такой модели поведения. 

Описанный способ принятия решений с помощью моделей поведения, 
т.е. с помощью последовательностей повторяющихся действий, мы назвали 
вторым механизмом принятия решений. Этот способ управления суще- 
ственно более эффективен, чем первый механизм, он более прост и требует 
меньше расчетов. 

Итак, управляющая система может переходить ко второму механизму при- 
нятия решений, если подходящая модель поведения найдена и она, как мини- 
мум, не ухудшает состояния объекта управления. Если состояние ухудшается, 
управляющая система отказывается от второго механизма и возвращается 
к первому механизму принятия решений. 

В памяти управляющей системы можно отвести специальный раздел «Па- 
мять моделей поведения». По своей сути модель поведения является образом, 
прообразом которого служит повторяющаяся последовательность действий. 
Следовательно, для обнаружения, хранения и распознавания моделей пове- 
дения можно использовать ту же подсистему формирования и распознавания 


образов (ФРО). 


Третий механизм принятия решений 


Рассмотрим теперь третий механизм принятия решений. Как было сказано 
выше, непосредственно в процессе работы управляющей системы подсисте- 
мой формирования и распознавания образов может постоянно, в «фоновом 
режиме», решаться задача, формирования образов. Для этого подсистема ФРО 
просматривает архив «Памяти распознанных образов» и «Памяти совершен- 
ных действий», содержащий временные последовательности идентификаторов 
распознанных образов и совершенных действий. Одним из видов найденных 
образов, как было сказано, могут быть регулярные последовательности совер- 
шенных действий — программы (модели) поведения вида 


У» = (Улту Ут,2, ее Ут, Е) Үр), 


содержащие последовательности, например, периодически повторяемых 
действий (периодичность не является единственно возможным видом регуляр- 
ности). Известно, что, например, во временнбй последовательности данных 
можно найти одновременно множество периодических компонент, в том 
числе при наличии шумовой составляющей и пропусков в данных. Поэтому 
вполне возможна ситуация, когда подсистемой ФРО могут быть найдены 
одновременно несколько периодических компонент — альтернативных моделей 
поведения: 


У! = (Ил, И2,..., роо УБР), 
У = (01,0,2,..., 0р... 0,р,), 


Ум = (Ум, Ума Умра УММ): 


2.11. Состав и функции подсистем адаптивной системы управления 99 


Управляющей системе следует принять решение, какую из этих альтер- 
нативных моделей поведения следует принять к исполнению. Надо оценить, 
к какому выигрышу в эмоциональной оценке приведет выполнение каждой 
из таких моделей поведения. Для этого управляющая система должна про- 
вести «мысленный эксперимент», моделирующий выполнение каждой из мо- 
делей. При этом вместо реальной системы «среда — объект управления — 
управляющая система» УС может использовать собственную Базу Знаний, 
которая по своей природе является моделью этой системы. На время принятия 
решения — на время проведения «мысленного эксперимента», управляющей 
системе следует запретить своим исполнительным устройствам реагировать 
на сигналы от подсистемы ФРО и БЗ. 

Так, для оценивания первой модели У! управляющей системе следует по- 
дать на БЗ команду Ү 1, и получить от нее отклик в виде распознаваемых об- 
разов, и оценить предполагаемое суммарное изменение общей эмоциональной 
оценки. Затем подать на БЗ команду У 2 и оценить ее вклад, просуммировать 
его с предыдущим, и т. д. до конца модели ў. Полученный результат есть 
предполагаемая оценка модели поведения Ұ;, обозначим ее через (У). Далее 
оцениваются величины 4(У) для всех альтернативных моделей поведения 
и выбирается к исполнению та модель поведения, которая обещает дать боль- 
шее приращение эмоциональной оценки 4 (если таких моделей несколько, то 
модель к исполнению выбирается среди них случайным способом). 

При этом очень интересно то, что для принятия решения о выборе лучшей 
из альтернативных моделей поведения не требуется введения в управляющую 
систему специальных подсистем. Весь расчет можно провести практически 
на той же «аппаратной части», которая предназначена для оперативного 
управления, т.е. для управления с помощью первого и второго механизмов 
принятия решений. Впрочем, указанное обстоятельство говорит о том, что, по 
существу, этот механизм принятия решений не отличается от первого и второго 
механизмов, а весь эффект следует из использования более сложных состав- 
ных «образов» и «действий». Однако образы всегда являются составными, и в 
этом отношении их можно развивать, по-видимому, беспредельно. 

Тем не менее, хочется выделить этот механизм принятия решений в отдель- 
ный механизм, чтобы подчеркнуть возможность и необходимость перехода, от 
работы с сигналами от датчиков к работе над более агрегированными инфор- 
мационными объектами. При этом мы получаем переход от количества в но- 
вое качество: просто усложняя состав образов, мы получаем многоуровневое 
иерархическое управление без необходимости надстраивания непосредственно 
новых уровней аппаратной части в управляющей системе. 


Четвертый механизм принятия решений 


Поскольку База Знаний представляет собой модель системы «среда — объект 
управления — управляющая система», то при определенном качестве такой 
модели ее можно использовать для принятия решений на несколько шагов 
вперед. База Знаний указывает эмпирически найденное отображение из мно- 
жества распознаваемых образов на само это множество, это отображение 
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действия 


образы = 


множество 
образов 


Рис. 2.23. База Знаний как отображение множества сформированных 
образов самого на себя посредством «действий» 


управляющая система может реализовать с помощью совершения «действий» 
(рис. 2.23). 

Если в БЗ найдутся отображения — «действия», из которых можно 
составить последовательную цепочку, то можно планировать многошаго- 
вые действия для достижения некоторого отдаленного конечного результата 
(рис. 2.24). Проверив альтернативные цепочки действий, управляющая си- 
стема может найти способ достижения искомого образа. 

Четвертый способ принятия решений осуществить непросто, прежде всего 
потому, что здесь существенную роль начинает играть различие между обра- 
зами «условия» и образами «результата» действия. Дело в том, что образы 
«условия», это те образы, которые мы распознаем фактически по результатам 
показаний наших датчиков. А образы «результата» — это образы, которые 
отражают то общее, что управляющей системе удалось найти в результате 
многочисленных актов совершения данного действия в данных условиях. Эти 
образы «результата» мы используем для предсказания результата действия. 

Поясним это на следующем примере. Рассмотрим ситуацию, когда водитель 
движущейся машины едет по не знакомому ему шоссе и подъезжает к месту, 
где шоссе делает поворот налево. Водитель выполняет действия, обеспечи- 
вающие поворот машины — поворачивает руль влево. При этом водитель 
распознал образ начала поворота непосредственно по показаниям своих орга- 
нов зрения. Решение выполнять поворот влево водитель принял на основании 
прогноза, что если он повернет налево, то там он увидит (распознает) образ 
продолжающейся дороги. Водитель распознал образ продолжающейся дороги 
еще до того, как его зрение увидело эту продолжающуюся дорогу. Произо- 


Рис. 2.24. Возможно многошаговое планирование действий, если База Знаний 
содержит соответствующие инцидентные отображения образов 
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шло опережающее распознавание образа «результата», или прогнозирование 
будущей ситуации. Спрашивается, что же это за образ «продолжающейся 
за поворотом дороги» распознал с упреждением по времени водитель, тем 
более, если он никогда ранее не ездил по этой дороге? Это такой образ, который 
сложился у водителя в результате прохождения многочисленных поворотов 
шоссе влево в прошлом. В этом образе «продолжающейся за поворотом до- 
роги» нет каких-то конкретных деталей — столбов, отдельных деревьев, знаков 
у дороги и т. п. Это нечто общее, что нашлось у всех ранее виденных данным 
водителем поворотов влево. Очевидно, что этот образ отличается от образа 
«начала поворота», распознанного водителем при входе в поворот, поскольку 
здесь были распознаны многочисленные конкретные детали (хотя, конечно, 
и здесь был распознан некий обобщенный образ «начала поворота влево»). 
Именно эти конкретные детали и позволили водителю принять точное реше- 
ние. Теперь спрашивается, может ли водитель машины, находящейся в начале 
поворота, на незнакомой дороге принять многошаговое решение, т. е. сказать 
точно, что он будет делать после прохождения левого поворота. В его Базе 
Знаний, скорее всего, нет или очень мало действий, связанных с ситуацией рас- 
познавания образа «продолжающейся за поворотом влево дороги». Возможно, 
это следующее знание: когда я распознаю образ продолжающейся за поворотом 
влево дороги, то я буду продолжать ехать некоторое время прямо и увижу 
какое-то продолжение дороги. Следующий шаг планировать уже практически 
нельзя, так как мы не можем точно планировать, куда нам придется пово- 
рачивать руль, если у нас есть только информация, что мы увидим какое-то 
продолжение дороги. Очевидно, что многошаговое планирование носит веро- 
ятностный характер, во-первых, в силу размытости образов «результата» даже 
в детерминированной среде (например, все изгибы шоссе зафиксированы и не 
меняются со временем, но сам образ продолжения дороги за поворотом размыт 
по своей природе), а во-вторых, оно зависит от вероятностных промежуточных 
событий, которые могут происходить после выполнения некоторого плани- 
руемого шага (например, водитель может увидеть за поворотом случайное 
препятствие, неожиданное расположение машин и т. д., чего в принципе нельзя 
точно знать, но можно предвидеть). 

Конечно, возможны и такие образы «результата», которые по точности 
не отличаются от образов «условия». Если при этом еще и отсутствуют 
возможности для появления случайных промежуточных образов, иницииро- 
ванных извне, то управляющая система может планировать свои действия 
на много шагов вперед — настолько, насколько позволяют зафиксированные 
в БЗ отображения образов на образы посредством «действий», а также воз- 
можности памяти для хранения планируемых действий и их следствий. Такая 
ситуация возможна, например, в игре в «15», когда отсутствуют случайные 
события, последствия каждого хода однозначно определены, а вся проблема 
планирования, т. е. многошагового принятия решения, связана только с огра- 
ниченными возможностями памяти, которая должна запоминать возможные 
планируемые ходы и их результаты. 
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Пятый механизм принятия решений 


Все рассмотренные выше механизмы принятия решений касались управления 
с одной целевой функцией — выживания, или улучшения текущей эмоцио- 
нальной оценки. Однако, как было сказано выше, у рассматриваемых нами 
систем управления должна быть и еще одна целевая функция — стремление 
к накоплению знаний. Удовлетворение этой целевой функции обеспечивается 
в результате разных процессов, происходящих в управляющей системе. Боль- 
шая часть из них связана с наличием той или иной случайной составляющей 
в принятом или выполняемом решении, что и обеспечивает возможность полу- 
чения новых данных для Базы Знаний. Наличие такой случайной компоненты 
обеспечивается самими алгоритмами управления, а также свойствами объекта, 
управления и среды. Однако эта цель получения новых знаний может дости- 
гаться не только автоматически, как это, скорее всего, происходит у простых 
организмов, но и в некоторых случаях «осознанно», целенаправленно. Напри- 
мер, при принятии решения предпочтение может отдаваться тем из альтер- 
нативных действий, которые имеют ббльшую неопределенность, именно для 
того, чтобы получить ббльшую прибавку новой информации. В общем виде — 
если предпочтение отдается цели выживания, то требуется совершение более 
определенных действий, обещающих меньше случайности в своих результатах. 
Если же предпочтение отдается цели накопления новых знаний, то требуется 
выбирать менее определенное действие, которое сулит больше неожиданного 
в своих результатах. 

Для иллюстрации приведем следующий пример: пусть мы принимаем ре- 
шение о выборе тропинки, ведущей к намеченной цели в некоторой местности. 
Если мы находимся в это время в состоянии выполнения служебных обязанно- 
стей и нам надо попасть к намеченной цели по делам, от которых зависит наше 
служебное поощрение, то мы выбираем максимально известный нам маршрут, 
сулящий меньше неожиданностей. Если же мы находимся на каникулах и про- 
сто совершаем прогулку с целью получения максимального удовольствия, то 
мы охотнее выберем новый не известный для нас маршрут, ибо он сулит новые 
впечатления, новые знания, что само по себе нам приятно, так как тем самым 
мы удовлетворяем «зашитой» в нас цели стремления к новым знаниям. 

Принятие решения о переходе к цели получения и накопления новых 
знаний, а также принятие решений под действием этой цели, безусловно, 
отличается от принятия решений с целью выживания, так же, как в ре- 
альной жизни учебная деятельность отличается от производственной или 
бытовой. О том, как можно формализовать способ выбора между целью 
выживания и целью накопления знаний, мы расскажем ниже. А здесь ука- 
жем на другую очень полезную возможность принятия решений с целью 
накопления новых знаний. Эта возможность связана с тем, что при нали- 
чии определенного минимума эмпирически найденных знаний в БЗ и при 
удачном способе представления этих знаний в БЗ существует возможность 
с помощью формальных подходов выявить новые знания, обобщив, интер- 
полировав и экстраполировав уже имеющиеся. На эту возможность и даже 
необходимость мы уже указывали в разделе «Алгоритм добывания новых 
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знаний». При этом механизме принятия решений управляющая система ра- 
ботает не с окружающей средой, а со своей Базой Знаний. Проанализировав 
накопленные знания, т.е. уже имеющиеся записи в пространстве БЗ, их со- 
держание и качественные оценки, управляющая система может в некоторых 
случаях построить гипотезу о том, какие именно знания могут находиться 
в еще не занятых участках пространства БЗ. Если мы вернем демона в управ- 
ляющую систему, то этот способ принятия решений будет выглядеть так. 
Демон, рассматривая записи в БЗ, и наблюдая там серию некоторых запи- 
сей, описывающих сходные ситуации, вдруг обнаруживает закономерность 
в этих записях и понимает, что некоторые из них можно попытаться вне- 
сти в БЗ, исходя только из этих закономерностей и без испытания среды. 
Естественно, здесь требуется определенная удача в выборе способа пред- 
ставления знаний в Базе Знаний. Кроме того, интерполяция и экстраполя- 
ция знаний возможны только в условиях выполнения некоторых требований 
(или при принятии определенных гипотез), таких как требование (гипотеза) 
о монотонности свойств системы. Это требование (гипотеза) предполагает, 
что реакции среды близки, если в близких условиях совершаются близкие 
действия. 

Выдвижение гипотез о новых знаниях на основе анализа уже имеющихся 
в БЗ знаний, принятие решений с учетом этих гипотетических знаний (напри- 
мер, для их проверки) составляют новый механизм принятия решений, кото- 
рый мы и выделяем в отдельный пятый механизм. Примеры его конкретизации 
будут приведены ниже. 

Перейдем теперь к более формализованному описанию системы ААУ и ее 
компьютерным моделям. Будем рассматривать подсистемы УС в соответствии 
с рис. 2.15. 
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Рассмотрим проблему синтеза систем автономного адаптивного управления 
на основе тех принципов, которые были представлены выше. Описывая каж- 
дую подсистему управляющей системы, мы вначале будем анализировать 
возможности построения систем, реализующих изложенные выше принципы 
и функции. Будет показано, что конструкции, которые реализуют указанные 
функции, возможны. После этого мы будем стараться ответить на вопрос 
«как именно нужно строить данную подсистему для заданной прикладной 


системы?». 
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3.1. Синтез блока датчиков 


В соответствии с рассмотренными в п. 2.5 положениями, касающимися датчи- 
ков, для практической реализации управляющих систем мы можем исполь- 
зовать устройства, передающие в УС информацию о текущем абсолютном 
значении наблюдаемого параметра (0-я производная) либо о его приращении 
(1-я производная). В биологии этому соответствуют тонические и фазические 
датчики, характеристические функции которых показаны на рис. 3.1. 


а) 6) 


Рис. 3.1. Импульсация тонической (а) и фазической (6) рецепторных клеток (внизу) 
в зависимости от силы приложенного внешнего раздражения (вверху) 


Более того, некоторые фазические рецепторные клетки могут регистриро- 
вать только приращение раздражения, а некоторые — только его уменьшение, 
т.е. на рис. 3.1 (6) цуг импульсов при приращении внешнего раздражения 
выдается одним рецептором, а цуг импульсов при уменьшении раздражения — 
другим. 

Для иллюстрации рассмотрим работу терморецепторов (рис. 3.2). Экспе- 
рименты, в которых изменяется температура воздействия и новый уровень 
удерживается достаточное время, показывают, что терморецентор порождает 
наиболее частые импульсы при определенной, оптимальной для него темпера- 
туре, снижает активность за пределами этого оптимума и, наконец, умолкает 
при значительном отклонении от него. В зависимости от диапазона активности 
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Рис. 3.2. Частота импульсации терморецепторов 
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различают холодовые и тепловые терморецепторы. У холодовых активность 
максимальна при температуре, лежащей в пределах 20-36° С, у тепловых же — 
при 40° С и выше. 

Как видно из рис. 3.2, в зоне перекрытия температур (28-45°С) активны 
те и другие рецепторы, поэтому для выяснения типа рецептора необходимо 
проследить и за его фазовыми реакциями на перепады температуры. Холодо- 
вые рецепторы отвечают на ступенчатое охлаждение учащением импульсов 
с овершутом, т.е. с большей начальной частотой, после чего ритм урежа- 
ется и устанавливается в соответствии с новой достигнутой температурой. 
На ступенчатое согревание они отвечают временным урежением или даже 
умолканием импульсов, затем возобновляющихся соответственно изменив- 
шейся температуре. Тепловые рецепторы обладают максимальной тонической 
активностью при температуре 40—46°С, а на перепады температуры реагируют 
противоположно холодовым. 

Информацию может нести также изменение частоты выходных нервных 
импульсов. Например, данную зависимость можно наблюдать на примере теп- 
ловых и холодовых рецепторов. На рис. 3.2 совмещены графики зависимости 
частоты импульсов от температуры для тепловых и холодовых рецепторов. 
Обратим внимание на диапазон от 30 до 45°С. В этом диапазоне при увеличе- 
нии температуры увеличивается частота сигнала, теплового рецептора, а при 
уменьшении температуры увеличивается частота, сигнала холодового рецеп- 
тора. Можно предположить, что именно этот диапазон и является «рабочим» 
для управления в этих областях температур. Температуры за пределами этого 
диапазона являются экстремальными и, как показано в [8], для регистра- 
ции температур в этих областях используются рецепторы другой природы, 
а показания рассмотренных холодового и теплового рецепторов не являются 
существенными для управления. 

Можно видеть, что разница фазических и тонических рецепторов состоит 
лишь в том, что опорным множеством для тонического рецептора является 
некоторое множество самих воздействий, а для фазического рецептора, опор- 
ным множеством является некоторое множество возможных приращений на- 
блюдаемого воздействия. 

Для реализации тонических датчиков в прикладных системах управления 
необходимо с помощью какого-либо аппаратного устройства или программным 
путем определить в пространстве признаков этого датчика опорное множество, 
такое, что при попадании в него регистрируемой величины датчик будет выда- 
вать единичный сигнал. В признаковое пространство должно входить и время. 
Например, пусть имеется некоторая переменная величина 2(#), изменяющаяся 
в диапазоне от Хиш до Хшах (рис. 3.3). Разобьем интервал [Хшш, Хшах| на № 
подынтервалов такой ширины, которая необходима для обеспечения требуемой 
точности управления. Ось времени также разобьем на интервалы Лі, соответ- 
ствующие требуемому характерному времени управления. Полученная сетка 
областей пусть образует опорные множества для № бинарных датчиков, один 
из которых будет срабатывать в каждый текущий такт # времени. Срабатывать 
будет тот датчик, в чье опорное множество в текущий момент времени попало 
текущее значение наблюдаемой величины =(#). 
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Рис. 3.3. Моделирование работы тонических рецепторов посредством № датчиков, 
имеющих неперекрывающиеся опорные множества — области во временном про- 
странстве признака 2(#) 


Будем отличать опорное множество органа чувств от опорного множества 
бинарного датчика. Например, опорным множеством для органа слуха — 
уха, является весьма широкий диапазон звуковых колебаний — примерно от 
16-20 Гц до 16-20 кГц. Но далее этот диапазон разбивается на очень большое 
множество маленьких диапазонов — опорных множеств для собственно би- 
нарных датчиков, каждый из которых распознается некоторым рецептором — 
бинарным датчиком, диапазон которого очень узок, например, с точностью 
до одной музыкальной ноты. При попадании измеряемой величины именно 
в это очень маленькое опорное множество, на выходе бинарного датчика, как 
мы будем полагать, выдается единичный сигнал, где «единичный» — тоже 
понятие условное, это логическое событие «ИСТИНА», которое может быть 
представлено одним импульсом или цугом импульсов определенной длитель- 
ности и частоты, в соответствии с принятым в системе протоколом. 
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Рис. 3.4. Моделирование работы фазических рецепторов посредством М датчиков, 
имеющих неперекрывающиеся опорные множества — области во временном про- 
странстве приращений т’ (#) признака 2(2) 
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Рис. 3.5. Многомерная матрица бинарных датчиков, распознающих образ поло- 
жения наблюдаемого объекта в многомерном признаковом пространстве фазовой 
плоскости 


Рис. 3.6. Опорные множества датчиков, наблюдающих переменную Х, могут 
пересекаться и/или являться подмножествами друг друга, что дает возможность 
выполнять логические преобразования над их показаниями 


Для моделирования работы фазических датчиков можно поступать ана- 
логичным способом, только работая в пространстве (2' (2), #) приращений, где 
(Е) = ах/ 4 (рис. 3.4). 

Если можно располагать измерительными приборами, регистрирующими 
состояние наблюдаемого объекта в текущий момент времени в некотором 
многомерном пространстве признаков, например, что типично, — в фазовой 
плоскости (2(#), т’(®)) (рис. 3.5), то можно сконструировать набор бинарных 
датчиков, опорными множествами которых будут являться непересекающиеся 
области, заполняющие все признаковое пространство — фазовую плоскость 
(200), 2' (0). Единичный выходной сигнал датчика, сработавшего в текущий 
момент $, несет управляющей системе (УС) информацию о том, что наблю- 
даемый объект находится в соответствующей датчику области пространства 
признаков. 

Опорные множества датчиков в признаковом пространстве могут быть 
представлены пересекающимися областями (рис. 3.6), а в некоторых случаях 
для организации адаптивного управления может понадобиться даже вложен- 
ное расположение опорных множеств бинарных датчиков, т. е. такое располо- 
жение, когда они образуют множества «сведений, сравнимых на общность» 


3.1. Синтез блока датчиков 109 


Рис. 3.7. Рецептивные поля (а) ганглиозных клеток в сетчатке 
глаза человека пересекаются (б) (по книге [9]) 


(см. п. 2.5). Для такой системы бинарных датчиков возможно выполнение 
логических преобразований и вычислений над логическими сигналами этих 
датчиков — вычисление логических преобразований с использованием опера- 
ций пересечения, объединения, логического отрицания. 

Эти положения вполне соответствуют свойствам биологических органов 
чувств. Вот как, например, расположены рецептивные поля ганглиозных кле- 
ток в сетчатке человеческого глаза, (рис. 3.7). 

Мы исходим из того, что всякий датчик представляет собой более или менее 
сложную систему распознавания. Поэтому к датчикам применимы все те про- 
блемы и решения, которые рассматриваются в системах распознавания. Так, 
выбор диапазона измерения, шкалы деления и точности датчика, соответствует 
задачам выбора оптимального признакового пространства и рабочего словаря 
признаков для системы распознавания. Для решения этих задач можно вос- 
пользоваться методиками, принятыми в теории систем распознавания. Обычно 
эти методики исходят из априорной информации о системе управления, для 
которой разрабатывается данная распознающая система. Далее решается оп- 
тимизационная задача поиска компромисса, между стоимостью системы распо- 
знавания, точностью ее решений, платежной матрицей стоимости правильных 
решений и ошибок 1-го и 2-го рода, априорными вероятностями появления объ- 
ектов того или иного классов, и т. д. Решение такой задачи довольно трудоемко. 
И это при том, что обычно для таких систем имеется множество априорной 
информации, а система распознавания может быть отнюдь не самообучаемой. 

В нашем же случае мы рассматриваем самообучаемые, адаптивные си- 
стемы. Здесь мы полагаем, что имеется минимум априорной информации. 
Поэтому применение обычных аналитических методик расчета оптимальных 
параметров датчиков представляется крайне затруднительным и практически 
неудобным. Мы полагаем, что более эффективным является применение мето- 
дов эволюционной оптимизации. Собственно, таким путем идет сама природа, 
конструируя и совершенствуя датчики, которыми она снабжает живые орга- 
низмы. Для каждого биологического вида, живых организмов природа методом 
проб и ошибок подобрала свой индивидуальный состав органов чувств — 
датчиков. А каждый датчик в процессе эволюции вида претерпевал изменения 
и настройки, становясь все более и более эффективным для условий существо- 
вания данного вида. Подбиралась, уточнялась и совершенствовалась форма 
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вспомогательных структур органов чувств (форма ушных раковин, глазных 
яблок, хрусталиков, волосковых рецепторов, расположение тактильных и дру- 
гих датчиков и т. д.). Уточнялись эффективные диапазоны регистрации воз- 
действий в спектрах электромагнитных волн — интервалы частот оптического 
диапазона, инфракрасного, температурного, интервалы регистрируемых аку- 
стических колебаний, диапазоны регистрируемых воздействий и т. д. 

В рассмотренных выше примерах (рис. 3.3-3.5) можно требовать уточ- 
нения, например, числа и ширины или даже формы диапазонов опорных 
множеств для каждого из бинарных датчиков. Эти диапазоны совсем не обяза- 
тельно должны быть равными или прямоугольными в признаковом простран- 
стве. Параметры датчиков могут сильно зависеть от условий, в которых рабо- 
тает данный объект управления (ОУ), и, в свою очередь, влиять на качество 
управления УС. 

Нами разработана методика [10] оптимизации параметров блока датчиков 
посредством такого известного метода, эволюционной оптимизации, как гене- 
тические алгоритмы. 

Коротко напомним суть генетических алгоритмов — широко используемого 
сегодня метода эволюционной оптимизации, моделирующего природный спо- 
соб поисковой оптимизации систем посредством хромосомного механизма пе- 
редачи наследственных признаков, их случайного смешения, мутаций и отбора 
удачных вариантов. Прежде всего, требуется закодировать свойства оптими- 
зируемого объекта, в виде кодового слова — «хромосомы». Способ кодирова- 
ния выбирается обычно эвристически. Например, это может быть последовал 
тельность параметров объекта, выраженная в двоичной форме и записанная 
в определенном порядке в одной строке. Один объект называется «индиви- 
дом». Свойства индивида, проявляемые им в реальном мире, составляют его 
«фенотип», а закодированное в хромосоме устройство индивида называется 
«генотипом». Вначале генерируется некоторое множество хромосом со случай- 
ными значениями параметров, и порождается первая пробная «популяция» 
индивидов, свойства которых (фенотип) различны, так как у них разные 
хромосомы. Вся эта популяция индивидов подвергается испытаниям, соот- 
ветствующим условиям их реальной жизни. По результатам этого испытания 
отбирается некоторая выборка наиболее удачных индивидов. Критерий отбора 
также устанавливается исследователем. Этот критерий, максимум которого 
и требуется отыскать, называется «фитнес-функцией». Отобранная выборка 
разбивается на пары «родителей». Затем с помощью каждой пары произво- 
дится несколько потомков, которые должны наследовать признаки их родите- 
лей. Для этого хромосома потомка составляется из двух хромосом родителей 
за счет того, что некоторые части хромосомы берутся от одного родителя, 
а другие части — от другого. Например, пара параллельно расположенных 
хромосом разрезается в случайном месте, и хвостовые части меняются ме- 
стами. Эта операция называется «кроссинговер». Полученные две хромосомы 
объявляются хромосомами двух потомков. Затем в хромосомы потомков вно- 
сятся небольшие случайные изменения — «мутации». Например, выбирается 
случайно некоторая буква в хромосоме и изменяется случайным способом 
(если это бинарные символы, то производится их инверсия). По полученным 
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хромосомам конструируются потомки. Совокупность всех потомков образует 
новую популяцию, численность которой может соответствовать численности 
исходной популяции. Над новой популяцией производятся те же операции. 
Постепенно индивиды становятся все более «приспособленными» к требова- 
ниям отбора — к «фитнес-функции». При этом мутации производят достаточно 
сильные изменения свойств потомков, что обеспечивает выход из локальных 
экстремумов «фитнес-функции», а скрещивание (кроссинговер) производит 
относительно слабые изменения свойств потомков, что обеспечивает постепен- 
ную сходимость к искомому экстремуму. Доказывается, что генетические алго- 
ритмы способны найти глобальный экстремум «фитнес-функции» за конечное 
число шагов при очень слабых ограничениях на вид функции. Например, 
«фитнес-функция» может быть очень сильно изрезанной или овражной. 

Применительно к проблеме оптимизации параметров блока датчиков си- 
стемы ААУ следует сказать, что здесь непросто указать «фитнес-функцию» 
для генетических алгоритмов, т.е. непросто сформулировать критерий сравне- 
ния и отбора лучших вариантов датчиков для заданной системы управления. 
Если рассматривать датчики отдельно от всей остальной системы, то, казалось 
бы, можно говорить о том, что лучшими могут считаться датчики, являющи- 
еся более информативными, приносящими управляющей системе больше ин- 
формации в единицу времени, эффективнее уменьшающие энтропию (неопре- 
деленность знаний) управляющей системы и т. п. Однако при более глубоком 
рассмотрении оказывается, что все такие критерии, предъявляемые к отдельно 
взятому блоку системы, неэффективны. Единственным критерием является 
тот, который характеризует качество функционирования всего ОУ как целого 
на протяжении всего его жизненного цикла в условиях той конкретной среды, 
в которой он находится. Поясним это на содержательном примере из биологии. 
Так, трудно сформулировать требования к глазам животного без учета, всех 
обстоятельств его жизни в заданной среде. Можно утверждать, что на свой- 
ства глаз влияют не только характеристики окружающей животного среды, 
но и форма хвоста животного, если он, этот хвост, как-то ограничивает поле 
зрения. Необходимая острота зрения, например, зависит от скорости движения 
животного И т. д. ИТ. п. 

В гл. 5 мы опишем несколько практических прикладных систем на основе 
метода ААУ. Там будут показаны и примеры оптимизации датчиков, именно — 
для системы управления мобильным роботом и для системы управления 
угловым движением космического аппарата. Будет показано, что, действи- 
тельно, генетические алгоритмы находят близкие к оптимальным параметры 
датчиков. При этом во всех случаях мы пользовались «фитнес-функцией», 
определенной с учетом характеристик качества всего жизненного цикла ОУ. 


3.2. Синтез распознающей системы 


Как было сказано выше, распознающая система УС состоит из вспомогатель- 
ных структур, рецепторных клеток и примыкающей к ним сети нейронов. 
Сетью нейронов осуществляется распознавание более сложных образов, чем 
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датчики 


в нервную систему 


Рис. 3.8. Фрагмент сети из нейронов 


те, которые могут быть распознаны непосредственно сенсорами — вспомога- 
тельными структурами и рецепторными клетками. 

Теперь рассмотрим нейронные структуры, которые должны выполнять 
функции самообучаемой системы распознавания. Не будем забывать, что 
такие структуры могут быть вынесены прямо в датчик, как в случае глаза, 
или являться большой частью собственно нервной системы и мозга. 

Обратимся к наблюдаемой биологами морфологической картине. Мы ви- 
дим, что на множестве выходов рецепторных клеток, по которым передаются 
унифицированные импульсы, начинается сеть нервных клеток, соединенных 
в целом нерегулярным способом и передающих информацию преимущественно 
по направлению от рецепторов вглубь нервной системы. Фрагмент такой сети 
показан на рис. 3.8. 

В сети возможны и петли обратных связей, например имеются связи, по 
которым информация передается во встречном направлении — от нервной си- 
стемы к органам чувств. Такие обратные связи могут охватывать один нейрон, 
идти к предыдущим соседним нейронам или идти к нейронам, расположенным 
далеко сзади, в том числе к самому входу сети — к органам чувств. 

Ранее мы указали, что назначением такой сети, начинающейся непосред- 
ственно на выходах датчиков, является распознавание образов необходимых 
управляющей системе явлений в потоке входной информации, поступающей 
на сеть от множества бинарных датчиков. Выше, при обсуждении логики 
адаптивного управления, мы старались ответить на вопрос, какая именно ин- 
формация является необходимой УС для управления, и нашли, что это, прежде 
всего, информация о неслучайных — повторяющихся событиях и явлениях. 
Если некоторый фрагмент входной информации неоднократно повторяется, 
то он может считаться неслучайным явлением, и информацию о нем можно 
запомнить и использовать в управляющей системе. Если событие случайное, то 
информация о нем не передается далее в УС. Например, лица прохожих в ос- 
новном не запоминаются нами, но если некоторое лицо встречается несколько 
раз, оно начинает выделяться нами среди других лиц, мы запоминаем его. 
Однако иногда и первый, и, возможно, даже единственный, раз увиденное 
нами явление способно запомниться на всю жизнь. Это такие явления, кото- 
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Рис. 3.9. Регулярная структура традиционной искусственной нейронной сети 
(ИНС), в которой каждый нейрон соединен с каждым нейроном предыдущего слоя 


рые связаны с сильными эмоциями. Например, мы надолго запоминаем лицо 
случайного прохожего, с которым повздорили, т.е. в акте участвовали сильные 
отрицательные эмоции. Либо запоминаем однажды увиденное лицо красивой 
женщины, которая произвела на нас сильное приятное впечатление. 

Примем, что нейросеть запоминает, распознает и пропускает дальше в нерв- 
ную систему образы либо неоднократно наблюдаемых явлений с нейтральными 
эмоциональными оценками, либо даже редко наблюдаемые явления, но с силь- 
ными эмоциональными оценками. 

Вначале рассмотрим первый случай, потому что здесь не нужно учитывать 
эмоциональных оценок, а достаточно только учесть информацию о числе 
наблюдений события. 

Напомним, что биологическая клетка-нейрон имеет несколько входов 
и только один выход, который может разветвляться на много отростков. 
Обычно один нейрон имеет от одного до нескольких сотен, возможно, даже 
около тысячи входов. Из биологических сведений мы знаем, что отдельный 
нейрон (возьмем нейрон, получающий входную информацию только от рецеп- 
торов) соединен не со всеми, а только с некоторыми из рецепторов-датчиков. 
Рецепторов, например, у человека — несколько миллионов. Поэтому очевидно, 
что один нейрон не может быть соединен со всеми рецепторными клетками или 
всеми нейронами предыдущего слоя нервной сети, как это принято в совре- 
менных традиционных искусственных нейронных сетях (ИНС), где каждый 
нейрон соединяется со всеми датчиками или всеми нейронами предыдущего 
слоя (рис. 3.9), что явно не соответствует биологическим данным. 


3.2.1. Модель нейрона типа І 


Начнем моделировать нейрон в соответствии с теми требованиями, которые 
ему можно предъявить, если наши рассуждения были правильными. Нейрон 
должен уметь решать две задачи: 


а) обнаружить некоторое закономерное явление на своих входах и запом- 
нить его (как образ), 
б) распознавать этот образ всякий раз при его появлении. 
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Задача (а). Как можно в самом общем виде характеризовать закономерность 
в потоке входных сигналов? Любая закономерность здесь состоит из двух 
составляющих. Это, во-первых, некоторое требование к пространственно- 
временной структуре сигналов — описание того, какие единицы и нули, по ка- 
ким входам, и в какой последовательности должны приходить на вход нейрона. 
А во-вторых, это статистическое требование, определяющее неслучайность 
этой конфигурации. Соответственно, при получении каждого вектора входных 
данных для решения задачи (а) нейрон должен уметь проверить две гипотезы. 
Первая гипотеза есть гипотеза о структуре образа. В нейроне должно быть за- 
писано некоторое «структурное» правило, описывающее определенный класс 
входных векторов и их последовательностей. Сложность этого «структурного 
правила» зависит от устройства «памяти» нейрона, в которую можно записать 
такое правило, и от устройства «механизма» проверки выполнения этого 
правила. Нейрон проверяет, удовлетворяет ли полученный входной вектор, 
вместе с его предысторией, этому «структурному правилу» или не удовле- 
творяет? Если не удовлетворяет, то нейрон никак не реагирует на полученный 
входной вектор. Если удовлетворяет, то нейрон проверяет вторую гипотезу — 
статистическую. Здесь нейрон должен проверить, является ли данная струк- 
тура входных сигналов, которую он распознал, статистически неслучайным 
событием. Для проверки этой гипотезы у нейрона должна быть некоторая 
специальная память, в которой записываются требуемые для проверки такой 
гипотезы величины — например, число наблюдений данной структуры и срав- 
нение этого числа, с порогом, или частоты наблюдения данной структуры, воз- 
можно — на некотором временном окне, например в определенном прошлом, 
или какие-то иные статистические правила. Сложность этих «статистических 
правил» также зависит от устройства «памяти» нейрона, в которую можно 
записать такое правило, и от устройства «механизма» проверки выполнения 
этого правила. Статистическое правило может быть «одноразовым» — когда 
правило может выполниться всего один раз за всю историю жизни нейрона. 
Например, простое правило «данная структура должна наблюдаться больше, 
чем М раз. В этом случае формируем новый образ». Для проверки такого 
правила нужен только счетчик числа № наблюдений прообраза (определенной 
структуры входных сигналов), память для хранения порога М и устройство 
сравнения величин Ми М. Сформированный образ здесь уже не «расформиро- 
вывается», не забывается и остается в системе навсегда. Правило может быть 
и более сложным, например: «образ считается сформированным, если частота, 
наблюдения данного прообраза за, последние сутки превышает величину Ё». 
Такое правило может выполняться много раз, поэтому однажды сформиро- 
ванный образ может быть и расформирован, забыт системой, а потом вновь 
быть сформированным, и так несколько раз. Для проверки такого правила 
понадобится более сложная память и более сложный механизм сравнения. 
Может ли такой механизм быть реализованным в нейроне? Возможно, что 
может. Другой вопрос — а целесообразно ли, чтобы управляющая система, 
однажды найдя некоторую закономерность, сформировав образ, потом забыла 
о ней, если она перестала наблюдаться? Для прикладной системы управления 
это может оказаться разумным с точки зрения экономии памяти, адаптации 


3.2. Синтез распознающей системы 115 


за счет переобучения, а не дообучения, но для биологической системы забы- 
вать о ранее приобретенных знаниях и навыках, в целом, неразумно. 

Если обе гипотезы выполнились в отношении текущего входного сигнала, 
то происходит акт обучения нейрона, нейрон становится обученным. Нейрон 
сформировал образ, этот образ должен быть запомнен в нейроне для того, 
чтобы нейрон мог распознавать этот образ всегда, когда на его входе появится 
прообраз этого образа. Если на нейрон смотреть как на самообучаемую си- 
стему распознавания, то в этот момент происходит изменение статуса, ней- 
рона — он становится обученной системой распознавания. Это означает, что 
нейрон выработал некоторое «решающее правило», с помощью которого он 
может теперь распознавать свой образ. Это выработанное решающее правило 
теперь должно быть как-то закреплено в нейроне. Для записи выработанного 
решающего правила можно использовать частично описанные выше струк- 
турное и статистическое правила. Так, структурное правило целиком остается 
и в решающем правиле обученного нейрона. Оно определяет структуру рас- 
познаваемого прообраза. А статистическое правило теперь упрощается — оно, 
например, может быть просто упразднено, т. е. если нейрон убедился ранее, 
что прообраз с данной структурой есть явление неслучайное, и запомнил 
это, то теперь для узнавания данного прообраза нейрону достаточно только 
распознать его структуру. 

По нашему убеждению, если нейрон на своем выходе может инициировать 
только один вид выходного сообщения, то такой нейрон может сформировать 
и распознавать только один образ. Это диктуется логической необходимостью 
однозначной интерпретации выходного сообщения нейрона. Другие нейроны 
и подсистемы, которые используют выходной сигнал нейрона, должны опи- 
раться на то предположение, что данный сигнал всегда означает распознавание 
одного и того же объекта или одного и того же класса объектов. Так, если 
мы полагаем, что выходной сигнал нейрона может быть представлен только 
одним унифицированным импульсом, то этот импульс должен означать, что 
был распознан образ, однозначно связанный с этим нейроном. Именно на этот 
вариант мы и будем опираться в дальнейшем. Биологический нейрон работает 
несколько сложнее — на выходе он генерирует серию импульсов, при этом 
частота следования импульсов может иметь несколько вариантов, которые со- 
ответствуют нескольким образам, которые может распознать данный нейрон. 


Задача (б). Это задача распознавания ранее сформированного образа. Она 
решается только тем нейроном, который уже обучился, т.е. сформировал 
образ. Если при обучении нейрона (т. е. при формировании образа) использу- 
ется «одноразовое» статистическое правило, то нейрон получает возможность 
распознавать образ только после того, как он обучился, и не теряет эту воз- 
можность до конца своей жизни. Если при формировании образа используется 
«многоразовое» статистическое правило, то возможность распознавать образ 
нейрон может неоднократно приобретать, когда он обучился, и терять (забы- 
вать образ), когда он разобучился. В обученном состоянии нейрон работает как 
система распознавания: он проверяет наблюдаемые входные векторы своим 
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«решающим правилом», и если оно выполняется, то нейрон распознает образ, 
о чем сигнализирует своим выходным сигналом. 

Конкретные нейрофизиологические механизмы, которые реализуют в ней- 
роне рассмотренные правила — структурное, статистическое и решающее, — 
могут быть реализованы в разнообразных формах, в которых могут участво- 
вать различные морфологические особенности, биохимические, электрохими- 
ческие, генетические и другие процессы. 

Можно, конечно, не рассматривать реализацию указанных правил, отно- 
сясь к ним исключительно формально. Однако нам представляется, что мы 
имеем право конкретизировать некоторые возможности реализации этих пра- 
вил, опираясь на сетевой вариант построения системы управления, принимая 
во внимание, что сетевые системы уже давно вошли в техническую и научную 


практику. 
Напомним, что сеть рассматривается как аналог биологической нервной 
сети, а узел сети — как аналог биологического нейрона. При такой трак- 


товке управляющей системы «структурное правило» нейрона реализуется 
в конфигурации связей данного нейрона в сети, а также в механизмах, 
обеспечивающих восприятие входных нервных импульсов. Например, сама 
конфигурация входных связей нейрона уже во многом определяет состав 
и структуру тех прообразов, которые могут восприниматься нейроном. Так, 
если нейрон соединен с выходами только некоторых рецепторов (датчи- 
ков), то это уже накладывает определенные «пространственные» ограничения 
на состав и структуру входной информации, которую может анализировать 
данный нейрон. Информация, поступающая на другие датчики, остается 
за пределами «поля зрения» данного нейрона. Если информация от рецеп- 
торов попадает на входы данного нейрона, пройдя последовательно через 
некоторое число других нейронов, и это число разное для разных входов 
нейрона, и при этом каждый нейрон имеет временную задержку, то это 
определяет «временные» характеристики той структуры сигналов, которую 
может анализировать данный нейрон. В целом получается, что структура 
связей данного нейрона в сети во многом определяет то «структурное пра- 
вило», которое анализируется нейроном. Самым простым «структурным пра- 
вилом» может быть получение полного единичного вектора на входе дан- 
ного нейрона, если уникальность такого вектора обеспечивается структу- 
рой нейросети. Именно этот простейший вариант «структурного правила» 
и используется в наиболее простой из разработанных нами моделей ней- 
рона (рис. 3.10). Более сложное «структурное правило» реализуется в био- 
логическом нейроне благодаря использованию других свойств самой нерв- 
ной клетки. Например, возможность различать состав сигналов, одновре- 
менно поступающих на синапсы нейрона, может быть основана на способ- 
ности синапсов выделять в межклеточную среду определенный химический 
медиатор при получении нервного импульса, а также на способности ме- 
диаторов влиять на рост синапсов. Известно, что один из механизмов пла- 
стичности синапсов связан с тем, что более активно растут те синапсы, 
на которые нервные импульсы приходят одновременно [11-13]. Эта чув- 
ствительность обеспечивается, возможно, взаимным влиянием синапсов друг 
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Рис. 3.10. Модель самообучаемого нейрона типа І 


на друга через среду посредством медиаторов. На такой способности ней- 
рона могут быть построены более сложные «структурные правила», опи- 
сывающие прообразы образов, которые могут быть сформированы нейро- 
ном [14]. 

«Статистическое правило» в нейроне может быть реализовано, по- 
видимому (это только наше предположение), на основе учета роста и разме- 
ров синапсов. Размеры синапсов, соответствующих коррелирующим входам 
нейрона, растут тем больше, чем чаще появляется данный прообраз. Если 
рост этот однонаправленный, то так может реализоваться «одноразовое» ста- 
тистическое правило. Если рост синапсов в биологическом нейроне может 
сменяться их деградацией, то в этом случае может реализоваться многоразовое 
статистическое правило. 

Смоделируем наиболее простые варианты из рассмотренных правил, опре- 
деляющих работу нейрона. Пусть на вход нейрона в дискретные моменты 
времени поступают бинарные векторы. Если т — число входов нейрона, а 4 — 
длительность закономерного явления в тактах, то очевидно, что нейрону надо 
указать хотя бы одно из не менее чем 2”9 «структурных правил», которое он 
будет проверять в качестве гипотезы. Если т небольшое, а 4 = 1, то самое 
простое правило, которое можно задать нейрону, — это единичный вектор. 
Иными словами, пусть нейрон считает явлением, статистические свойства 
которого ему надо исследовать, только ситуацию, когда единичные импульсы 
поступили на все его входы одновременно. 

Следовательно, первым элементом в устройстве нейрона должен быть 
элемент, который реализует выполнение некоторого «структурного правила» 
классификации входных векторов, делящего все векторы на два класса: век- 
торы, с которыми нейрон будет работать дальше и все остальные, которые 
нейрон будет игнорировать. Обозначим такой элемент буквой В (рис. 3.10). 

Выходной сигнал 6 этого элемента будет равен «1», если элемент В рас- 
познал, что входной вектор соответствует тому классу векторов, с которыми 
работает данный нейрон. В принятом случае пусть элемент А отрабатывает 
простое «структурное» правило — логическое «И», это самое простое, что 
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можно придумать. Итак, пусть в нашей простой модели нейрона сигнал 6 равен 
«1», если все входные сигналы =;, 1 = 1,...,т, равны «1». В сети этот нейрон 
будет реагировать сигналом 6 = 1 только на ситуацию, когда на тех т датчи- 
ках, к которым он присоединен, одновременно появятся единичные сигналы. 
Очевидно, что правило, отрабатываемое элементом А, может быть намного 
сложнее, чем логическое «И». Ниже мы рассмотрим некоторые примеры таких 
правил. Итак, «структурная гипотеза» проверяется в нейроне элементом В. 

Если необученный нейрон обнаружит вектор, удовлетворяющий принятому 
структурному правилу А, то после этого он должен проверить статистиче- 
ское правило. Представителем сигнала, удовлетворяющего правилу В, теперь 
является сигнал 6 = 1. Нейрон должен понять, является ли событие В = 1 
неслучайным в его жизни или же оно случайно. Для принятия такого решения 
нейрон может опираться только на такие понятия, как число № появлений 
сигнала 6 = 1, которое он может сравнивать, например, с некоторой констан- 
той М, зависящей от планируемого времени жизни нейрона, выраженного 
в единицах тактового сигнала. Если число М№ превзойдет константу М, то 
нейрон может принять решение, что сигнал 6 = 1 не случаен в его жизни. 
Пороговая величина, М определяет «уровень скептицизма» нейрона. Так, если 
задать М = 1, то нейрон при первом же появлении сигнала 6 = 1 решит, что 
соответствующий входной вектор есть неслучайное явление в системе и его 
надо запомнить как образ. 

Итак, следующим элементом, который должен быть в нейроне, является 
элемент Г’, проверяющий «статистическую гипотезу». Элемент Г, осуществляет 
подсчет числа № событий 6 = 1 и сравнение накопленного числа № с заданной 
константой М. Пока № < М, элемент Г, не пропускает сигнал 6 = 1 в точку с 
(см. рис. 3.10), но когда число № превзойдет порог М, элемент Г, становится 
прозрачным для сигнала 6, и сигнал с становится всегда равным сигналу 6. 
Теперь мы имеем сигнал с, который равен «1» только тогда, когда нейрон, 
во-первых, «убедится», что различаемая им комбинация единичных сигналов 
на входе нейрона (в нашем случае — единичный вектор) не есть случайное 
событие в системе (во всяком случае, нейрон видел его в своей жизни уже 
не менее, чем М раз), а во-вторых, в текущий момент нейрон наблюдает 
именно этот сигнал на своих входах. Если элемент Г уже начал пропускать 
единичные сигналы (т. е. если № > М), то будем говорить, что этот нейрон 
уже обучен. Элемент Г можно назвать пороговым элементом накопления 
статистики. Элементы В и Г, вместе играют роль системы автоматической 
классификации, использующей структурный и статистический критерии для 
образования класса — образа. 

Однако сигнал с = 1 не подходит на роль выходного сигнала нейрона 
потому, что его длительность равна времени, в течение которого нейрон 
наблюдает на входе породившую его комбинацию сигналов (прообраз). Как 
только прообраз исчезает с входов нейрона, сигнал с становится равным «0», 
т.е. нейрон «забывает» о том, что он только что распознал этот образ. Это 
эквивалентно тому, как если бы мы, читая книгу, распознавали букву в слове, 
но как только переводили взгляд на следующую букву, то тут же забывали 
бы предыдущую. У нейрона должна быть кратковременная память, которая 
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некоторое время будет помнить о том, что он распознал образ, даже после 
того как прообраз исчез из его поля зрения. Для того чтобы ввести такую 
кратковременную память, поставим на выходе нейрона триггер Т, который 
будет включаться сигналом с = 1 и удерживать выходной сигнал О = 1 на вы- 
ходе нейрона вплоть до поступления специального отключающего сигнала 
5 = 1. О необходимости и возможных источниках сигнала 5 = 1 поговорим 
немного позже. На триггерный элемент Т возложим еще одну функцию — 
быть элементом задержки, выполняя функцию синаптической щели нейрона, 
привносящей в срабатывание нейрона синаптическую задержку. Временная 
задержка в узлах нейронной сети имеет принципиально необходимое значение, 
так как она обеспечивает возможность распознавания временных явлений, 
в частности — причинно-следственных явлений. Чтобы подчеркнуть, что от 
момента прихода входных сигналов до момента появления выходного сигнала 
проходит некоторое время, будем считать, что это время задержки равно 
одному такту времени, и пометим входные сигналы верхним индексом Ё, 
а выходные — индексом # + 1. 

В соответствии со сказанным, выходной сигнал нейрона в момент времени і 
будет равен «1» в следующих двух случаях. Во-первых, если нейрон уже 
является обученным (Л > М) и при этом на входе нейрона в момент & — 1 
была комбинация сигналов, удовлетворяющая правилу В. Во-вторых, если 
нейрон уже выдавал сигнал О = 1 ранее. Кроме того, в обоих случаях 
необходимо, чтобы в момент і — 1 не было отключающего триггер сигнала 
5 = 1. Если все сигналы в нейроне полагать равными логическим переменным, 
принимающим значения «1» или «0», то все это словесное описание можно 
заменить логическим выражением 


О (БА) О"). (5) 
Здесь О" — выходной сигнал нейрона в момент времени (Ё- 1), 5 — 
инверсия сигнала 5°, $ — сигнал в точке 6,  — логическая переменная, 


выражающая обученность элемента Г: 


0, если № < М, 


р 
рт 1, если №>М, 

О" — выходной сигнал нейрона в момент времени (#), & — логическая функция 

«И», У — логическая функция «ИЛИ», ~ — логическое отрицание. 

Понятно, что когда нейрон сработал и поддерживает на своем выходе 
сигнал О = 1, нейрон этим самым как бы вывешивает флажок, сообща- 
ющий окружающим нейронам о том, что он распознал свой образ, однако 
в этом состоянии нейрон перестает быть чувствительным к входному сигналу. 
Окружающей нейросети следует взять у нейрона информацию о факте распо- 
знавания этого образа и освободить нейрон от необходимости поддерживать 
единичный сигнал на своем выходе, перевести его в обычный режим слежения 
за входным сигналом. Эту функцию выполняет сигнал 5. Для объяснения 
его роли необходимо рассмотреть фрагмент нейросети, содержащий структуру 
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Рис. 3.11. Фрагмент сети нейронов 


связанных между собой нейронов. Пусть имеется четыре нейрона, связанных 
так, как показано на рис. 3.11. 

Пусть нейроны т, по и пз выдавали свои единичные сигналы одновременно 
М раз, так, что нейрон пл обучился распознавать этот образ. Будем помечать 
сигналы нейрона п индексом ш. И вот в очередной раз, когда происходит 
событие 


О0о, 


нейрон лд тоже срабатывает и выдает сигнал О{ = 1. Очевидно, что почти 
вся информация о событии заключена в сигнале Ой = 1. Зная структуру 
связей нейрона тд и момент появления сигнала Ой = 1, мы можем приблизи- 
тельно восстановить события на предыдущем такте. Поэтому после получения 
сигнала Ой = 1 можно сбросить единичные выходные сигналы на выходах 
нейронов 71 , 72 и пз. Это может сделать нейрон пл, послав нейронам 71 , 72 и пз 
отключающие их триггеры сигналы 51 = 1, 52 =Ти 5; = 1, через свой выход 
74 = 1 после того, как он сам распознает этот образ. Конструктивно это вы- 
глядит так: нейрон п, в момент распознавания образа посылает отключающий 
сигнал 7, на входы 5 нейронам, инцидентным его входам. Сигнал 4, можно 
снимать с точки с нейрона (рис. 3.10). Тем самым, каждая пара инцидентных 
нейронов в сети связана двумя связями: по одной в прямом направлении пере- 
дается сигнал О,, по другой в обратном направлении передается сигнал 4. 
Кроме того, отключающий сигнал на нейрон может приходить и из других 
отделов управляющей нервной системы, например, из подсистемы принятия 
решений, которая также состоит из нейронов. 

В схеме нейрона между точкой с и выходом Й„ расположен элемент С, 
который функционально аналогичен элементу Г, т.е. тоже является пороговым 
элементом накопления статистики. Он так же, как и элемент Г, начинает 
пропускать сигнал с = 1 на выход Й. не сразу, но только после того, как 
число Р событий с = 1 превысило установленный порог 0). Это приводит 
к тому, что в @ первых случаях срабатывания нейрон не посылает отклю- 
чающий сигнал 7, и поэтому в этих случаях одновременно индицируются 
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сигналы и от данного нейрона, и от инцидентных его входам нейронов. Эти 
© первых случаев управляющей системе нужны для того, чтобы научиться 
правильно реагировать на распознавание этих образов, о чем будет подробнее 
сказано ниже при обсуждении механизмов принятия решений. Такая обратная 
связь, охватывающая соседние нейроны, является важным, но не единствен- 
ным способом использования «отключающего» сигнала И. 

Вторым назначением «отключающего» сигнала Й„ нейрона может быть 
имитирование функции, которую, по нашему мнению, выполняет возвратная 
коллатераль аксона биологического нейрона (рис. 3.12 (а)). Если обычным 
выходным сигналом нейрона является длительный цуг импульсов, то сигнал 
обратной коллатерали, поданный на тормозящий синапс, может остановить 
генерацию выходных сигналов. Эффекта такой отрицательной обратной связи 
на нашей модели нейрона мы можем добиться двумя способами: подачей 
отключающего выхода 2, на вход 5 (рис. 3.12 (6)) или подачей основного 
выхода О на вход 5, (рис. 3.12 (в)). Оба этих способа позволяют ограничить 
длительность основного выходного сигнала О,,, если это необходимо. Однако 
между ними есть определенная разница. Покажем ее на протоколах соответ- 
ствующих экспериментов. 

Возьмем нейрон, с такой обратной связью, как на рис. 3.12 (6), и обозначим 
его пі. Пусть для простоты у нейрона т будет всего один основной вход, т. е. 
т = 1. Возьмем другой нейрон, с такой обратной связью, как на рис. 3.12 (в), 
и обозначим его пг. Пусть у нейрона 72 тоже будет всего один основной вход, 
т.е. т = 1. Нейроны не связаны друг с другом и образуют «сеть», показанную 
на рис. 3.13 (а). Пусть оба нейрона вначале будут необученными, и пусть оба 
имеют константы М = 1 и О = 1. Будем подавать на нейрон т; сигналы 
с датчика 41, а на нейрон тз — сигналы с датчика 42, пусть эти сигналы будут 
идентичными. Результаты экспериментов проиллюстрируем с помощью вре- 
менных диаграмм, показывающих непрерывные последовательности входных 
и выходных сигналов этих нейронов. 

На рис. 3.13 (6) показано, как обучаются оба нейрона. На оба датчика подал 
ется одинаковый непрерывный единичный сигнал. К моменту їз оба нейрона 
обучились, и в момент ід оба нейрона сработали, распознав образ и выдав 
на выход по единичному сигналу Оу и Оз. Однако, начиная с момента ё5, 
поведение нейронов уже различно. Нейрон ту еще раз выдает единичный 
выходной сигнал О; и отключается в этой сессии совсем. Нейрон пз, напротив, 
в момент $5 отключает свой выходной сигнал О, а далее начинает попеременно 
включать и выключать его. 

На рис. 3.13 (в) показано, как оба этих, уже обученных, нейрона реагируют 
на единичный однотактовый входной сигнал. Реагируют они одинаково, ге- 
нерируя однотактовый единичный выходной импульс на следующем такте, 
который говорит о том, что нейроны распознали свои образы. 

На рис. 3.13 (г) показано, как обученные нейроны реагируют на постоянный 
единичный входной сигнал. Оба нейрона распознают образ, реагируя на него 
единичным сигналом на следующем такте, но нейрон п1 выдает один выход- 
ной импульс О, а нейрон п2 генерирует периодическую последовательность 
импульсов О». 
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Рис. 3.12. Возвратная коллатераль биологического нейрона, по-видимому, организу- 

ющая отрицательную обратную связь, с помощью которой нейрон может прекратить 

генерацию цуга своих собственных выходных сигналов (а); моделирование указанной 

функции коллатерали с помощью подачи: «отключающего» выходного сигнала 4 

на «отключающий» вход 5 (6); основного выходного сигнала О на «отключающий» 
вход 6 (в) 
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Рис. 3.13. Временные диаграммы, показывающие, как нейроны с разными спосо- 
бами организации отрицательной обратной связи обучаются и распознают простые 
образы. Черными кружками помечены «отключающие» входы и выходы (а) 


Таким образом, разные способы организации обратной связи дают разные 
результаты, что расширяет возможности выбора конфигурации нейросети 
на этапе ее конструирования. 

Наконец, третьим назначением «отключающего» сигнала Й„ может быть 
организация некоторых стандартных «программ» действий, которые могут 
быть зафиксированы в самой распознающей нейросети. Эту возможность мы 
рассмотрим ниже (в п. 3.2.10). 

Если мы приняли, что сигналы в нейросети представлены унифицирован- 
ными по форме импульсами (имитирующими нервные импульсы), то выход- 
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ной сигнал триггерного элемента Т, имеющий большую протяженность во 
времени, можно представить, например, серией (цугом) импульсов, идущих 
с определенной скважностью, или частотой. Эта частота следования выходных 
импульсов сама по себе может нести некоторую информацию, и эту воз- 
можность природа активно использует в нервных системах. Однако мы пока 
не будем моделировать этот дополнительный канал передачи информации. 
Коснемся только длительности такого цуга импульсов. Биологический нейрон 
не может генерировать цуг выходных импульсов очень большой длины, он 
имеет некоторый предел длительности. Этот предел может являться вторым 
из возможных способов остановки нейрона, генерирующего выходной сигнал, 
наряду с рассмотренным выше отключающим сигналом 5 = 1, приходящим 
на специальный вход нейрона. 

Теперь вернемся к сети, составленной из датчиков и описанных здесь 
нейронов, и рассмотрим, как она работает. Вначале договоримся о терми- 
нах. Межнейронной связъю будем называть нервное волокно, соединяющее 
выход одного нейрона или датчика с входом другого нейрона. Пусть порядком 
нейрона называется число К последовательно идущих связей, которые надо 
преодолеть сигналу на самом длинном из всех путей от какого-либо датчика 
до данного нейрона. Так, на рис. 3.8 (с. 112) нейроны 1, 2 иЗ имеют порядок 1, 
нейроны 4, 5, 6 — порядок 2, нейроны 7 и 8 — порядок 3, а нейрон 9 является 
нейроном 4-го порядка. Для удобства целесообразно датчики полагать нейро- 
нами 0-го порядка, поскольку их выходные сигналы ничем не отличаются от 
выходных сигналов нейронов. 

При принятом выше простом правиле В, с каждым нейроном п, ассо- 
циируется один образ, который будем обозначать буквой О„. Если нейрон 
т обучен, то говорим, что образ О„ сформирован, если нейрон не обучен, 
то соответствующий ему образ не сформирован. Если нейрон п, сработал, 
т. е. выдал сигнал О, = 1 (согласно формуле (5)), то говорим, что образ О, 
распознан. Понятно, что распознавать образ может только обученный нейрон. 

Итак, пусть на датчики из среды поступают случайные возбуждения, что 
приводит к появлению на выходах датчиков случайных, не коррелированных 
единичных сигналов. Если сеть собрана так, что число входов у нейронов 
достаточно велико, а константы М у нейронов высоки по сравнению с планиру- 
емым временем жизни сети, то при случайном характере входных сигналов ни 
один из нейронов может так и не обучиться в течение жизни сети. Однако если 
среда, пусть даже на фоне случайного шума, будет многократно предъявлять 
датчикам некоторый объект, что отразится в появлении во входном потоке 
векторов определенной повторяющейся конфигурации коррелированных сиг- 
налов, и если в структуре сети найдется хотя бы один нейрон 1-го порядка, 
на который эти коррелированные единичные сигналы будут попадать одновре- 
менно, то такой нейрон сможет обучиться и тем самым сформировать образ. 
Возможно, что данный предъявляемый средой объект породит даже несколько 
образов 1-го порядка. 

Нейроны 1-го порядка, которые обучились, сформировали свои образы, 
теперь будут распознавать эти образы всякий раз, когда те будут появляться 
перед датчиками. 
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Если теперь в сети найдется нейрон 2-го порядка, который обнаружит, 
что он наблюдает коррелирующие сигналы от соответствующих источников — 
датчиков и нейронов 1-го порядка, то, возможно, что такой нейрон 2-го 
порядка или несколько таких нейронов тоже обучатся. Обучившиеся нейроны 
к-го порядка при распознавании образов создают условия для обучения на сле- 
дующем такте времени некоторых нейронов (К + 1)-го порядка и т. д. 

Напомним, что нейроны Ё-го порядка (Е > 2) при срабатывании посылают 
отключающие сигналы назад, инцидентным им нейронам (К — 1)-го порядка. 
Итак, переходные процессы в такого рода нейросети состоят в следующем. При 
получении входного вектора от датчиков, в сети в направлении возрастания 
порядков нейронов начинает распространяться волна, сигналов, отмечающих 
акты распознавания образов обученными нейронами. Это своего рода «кон- 
вейерный» процесс, где одновременно параллельно срабатывают нейроны од- 
ного порядка, передавая на следующем такте эстафету нейронам следующего 
порядка. Одновременно эти сигналы способствуют процессу обучения еще 
не обученных нейронов — это скрытый внутри нейронов процесс накопления 
ими статистической информации в счетчиках Г. В сети идет также процесс 
передачи отключающих сигналов от сработавших нейронов больших порядков 
на один шаг назад к нейронам меньших порядков. Нейроны наибольшего 
порядка из всех сработавших отключаются либо по достижении предельной 
длины цуга своих выходных импульсов, либо отключающим сигналом, при- 
шедшим из других подсистем УС, а таковые сигналы могут подходить, при 
необходимости, к любому из нейронов распознающей сети. 

Процесс распознавания образов обученными нейронами выглядит так. Сна- 
чала нейроны 1-го порядка распознают элементарные образующие — «буквы», 
на следующем шаге нейроны 2-го порядка распознают «слова», отключая рас- 
познанные нейронами 1-го порядка «буквы» (вся информация о распознанных 
«буквах» переходит при этом в распознанные «слова»). Затем нейронами 3-го 
порядка распознаются «предложения», в которые переходит информация от 
распознанных «слов», и образы «слов» отключаются. И так далее до того 
момента, пока процесс распознавания не достигнет «конечных» нейронов, т. е. 
нейронов наибольшего порядка из числа обученных. Поскольку со временем 
число обученных нейронов в УС увеличивается, то предъявление одного и того 
же прообраза управляющей системе, находящейся на разных стадиях своего 
развития, может вызывать распознавание различных «конечных» образов. У 
управляющей системы с меньшим опытом распознанный «конечный» образ 
будет иметь меньший порядок и опираться на меньшее число разных образу- 
ющих. А УС с большим опытом может в этой же ситуации распознать «конеч- 
ный» образ большего порядка, основанный на большем числе образующих, ко- 
торые эта более продвинутая УС уже научилась распознавать в том же самом 
предъявленном ей объекте. Этот эффект еще больше усиливается эффектом 
ассоциативного распознавания, о котором будет сказано несколько ниже. 

Интересным примером, на наш взгляд — подтверждающим описанный 
механизм распознавания, является обошедший Интернет следующий пример 
эффекта, состоящего в том, что при распознавании текста, человеком не столь 
важную роль играет последовательность букв в слове, сколько их состав: 
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По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт 
занчнеия, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы преавя 


и пслоендяя бкувы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм 
бсепордяке, все-рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся 
то, что мы чиатем не кдаужю бкуву по отдльенотси, а все солво цликеом. 


Будем называть прообразом ту совокупность сигналов, которая заставила 
данный нейрон сработать, т. е. распознать образ. Более того, данный прообраз 
своим повторением в прошлом был и причиной формирования данного об- 
раза. Отдельный единичный сигнал из прообраза будем называть образующей 
прообраза данного образа. Под прообразом можно понимать совокупность сиг- 
налов от нейронов и датчиков, непосредственно связанных с входами данного 
нейрона. Такой прообраз будем называть непосредственным прообразом. Под 
прообразом можно понимать и ту комбинацию породивших данный образ 
сигналов, которая имела место на выходах датчиков, такой прообраз будем 
называть истинным прообразом. Наконец, можно говорить об объекте в среде, 
который отразился в УС в виде образа, пусть это будет прообраз-обзект. 

Теперь обратим внимание на то, что нейрон порядка К может быть соеди- 
нен своими входами с нейронами разных порядков от А — 1 до 0. Поэтому 
если непосредственный прообраз представляется одновременно пришедшими 
единичными сигналами, то соответствующий истинный прообраз мог быть 
представлен единичными сигналами, наблюдавшимися на различных датчи- 
ках в различные моменты времени. Тем самым, истинным прообразом образа 
порядка К > 2 может быть определенный пространственно-временной процесс, 
наблюдавшийся датчиками. Поясним это на примере сети, представленной 
на рис. 3.8 (с. 112). Пусть нейрон 9 в момент # распознал образ, т.е. выдал 
единичный сигнал Оу = 1. Изобразим временную диаграмму сигналов в сети, 
которые могли привести к этому событию (рис. 3.14). 

Мы видим, что для того чтобы сработал нейрон 9, на датчики нужно 
было подавать импульсы в определенном порядке, т.е. образ Оз отражает 
определенное временное явление в среде, а не просто статическую картинку. 

С учетом того что сработавшие нейроны посылают отключающие сигналы 
своим образующим, в истинном прообразе некоторых образов могут быть 
необходимы не только единичные импульсы, но и отсутствующие импульсы. 

Описанный эффект, возникающий из-за нерегулярностей связей между 
нейронами в сети и наличием временных задержек у нейронов, очень важен, 
так как он позволяет формировать образы пространственно-временных явле- 
ний, истинные прообразы которых состоят из определенных последователь- 
ностей входных сигналов, где важны и единицы, и нули. Примерами таких 
образов могут быть, например, 


— образ определенной музыкальной ноты, представленный строго перио- 
дическими сигналами от соответствующих датчиков (рис. 3.15 (а)); 
— образ процесса, состоящего из последовательности конкретных событий 


(рис. 3.15 (6)); 
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Рис. 3.14. Временная диаграмма, показывающая сигналы в сети (см. пример 

на рис. 3.8), которые привели к распознаванию образа О». Предполагается, что 

предварительно обучены все названные нейроны. Показаны истинный и непосред- 
ственный прообразы образа Оо 


— образ причинно-следственного явления, когда следствие наступает 
только после появления причины (рис. 3.15 (в)). 


Обратим внимание на следующее важное обстоятельство. Очевидно, что 
от того, как было определено правило В для распознающей части нейрона, 
зависит вид отношения образа и его прообраза. Из-за того, что нейрон в любом 
случае осуществляет конвергенцию сигналов, трудно ожидать взаимно одно- 
значного соответствия образа и его прообраза. Сама идея «образа» по своей 
сути предполагает, что образ отражает то общее, что есть у многих конкретных 
явлений, породивших его. Поэтому при разворачивании предыстории образа 
с помощью нейросети в обратном, дедуктивном, порядке мы будем получать 
некоторое множество возможных вариантов прообраза, т. е. будет иметь место 
некоторая неопределенность прообраза. Множество различных прообразов 
могло породить данный определенный образ, и множество различных объ- 


а) 6) в) 


м ——————————— 
периодическии последовательный причина следствие 
сигнал процесс 


Рис. 3.15. Примеры прообразов а) периодического процесса, б) последовательного 
процесса, в) причинно-следственного процесса 
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ектов будут распознаваться как один образ. Это надо признать естественным 
эффектом, а не недостатком предлагаемой модели. 


3.2.2. Помехоустойчивость нейрона 


Вернемся к рассмотрению модели нейрона. Обратим внимание, что с ростом 
числа №, равного количеству актов распознавания данным нейроном своего 
образа, увеличивается статистическая уверенность в том, что явление (объект 
или процесс), которое вызывает распознавание этого образа, действительно 
существует в системе. С ростом числа № уменьшается вероятность ложной 
тревоги — вероятность того, что нейрон ошибся и среагировал на случайное 
явление. Если мы удовлетворимся только некоторой постоянной вероятностью 
ложной тревоги, то ее уменьшение мы можем употребить на увеличение 
помехоустойчивости данного нейрона. Можно разрешить нейрону увеличивать 
допустимый уровень зашумленности прообраза в прямой зависимости от рас- 
тущего числа № при сохранении вероятности ложной тревоги на заданном 
фиксированном уровне. 

При принятом выше простом решающем правиле В (распознается только 
единичный вектор), зашумленность сигнала будет проявляться в появлении 
в единичном векторе нулевых компонент вместо некоторых единичных. За- 
шумленность тем выше, чем меньше доля единичных компонент во входном 
векторе, т.е. чем меньше число р = ћ/т Е [0; 1], где ћ — количество единичных 
компонент во входном векторе, а т — размерность вектора. 

Чтобы реализовать свойство помехоустойчивости в нейроне, сделаем ло- 
гическую функцию «И», которая составляла правило В, пороговой функцией 
«И», а порог р будем уменьшать в зависимости от числа №, накопленного 
счетчиком Г, нейрона, например, так, как это показано на рис. 3.16. 

Начальное значение порога ршах может быть меньше или равно 1, а 
минимальное ри должно быть заметно больше 0, иначе нейрон начнет 
срабатывать от многих входных векторов. Итак, с введением порога, нейрон 
будет вырабатывать сигнал 6 = 1 только при условии, что доля ћ/т единичных 
компонент во входном векторе превышает допустимое при текущем № значение 
порога р(№). 


М М 


Рис. 3.16. Снижение порога нейрона. Допустимый уровень зашумленности распо- 
знаваемого входного сигнала обратно пропорционален уровню порога, 
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Конечно, введением порога р(№) мы увеличиваем неопределенность 
предыстории и прообраза распознанного образа. Однако приобретаем 
несколько очень полезных возможностей, среди которых мы рассмотрели 
пока только помехоустойчивость нейрона. Другие возможности и эффекты, 
связанные с введением порога р(№), мы обсудим позже (это будут способность 
управляющей системы к прогнозированию и языковые явления). 

Итак, полное математическое описание предлагаемой модели нейрона 
(рис. 3.10, с. 117), которую мы назвали нейроном типа І, состоит в следующем. 
Будем помечать индексом ш сам нейрон п, и все относящиеся к этому нейрону 
элементы. 

На вход нейрона п. в момент їі поступает двоичный вектор 


рем в) 


и сигнал 5%. 
В момент #-+ 1 нейрон производит выходные сигналы О! и 2! согласно 
логическим выражениям 


Об = 9. (ш) 0%) и 
261 6 610 де. 


Значение сигнала 0%, в точке «Б» определяется зависимостью 


Ри 
Т 1, если == > (№), 


10 = 
0, в других случаях. 


Здесь р есть число таких компонент 2; вектора Х", которые имеют значение 1 
в момент Ё; № есть число событий 6', = 1 в предыстории этого нейрона от & = 0 
до &; р(№) есть сигмоидальная функция. Последняя определена для значений 
М =0,1,..., и уменьшается от некоторого значения р(0) = ршах, ршах < 1, до 
значения р(оо) = рш, Оша < ршах: 
Кроме того, 
рМ) = рм, ртіп < ОМ < ртах; 


где М есть константа. 
Значения рах, Ом, шіп и М задаются для каждого нейрона априори. 
Переменная р. показывает состояние элемента Г, в момент # и может 
принимать значения 0 или 1 согласно условию: 


т 0, если № < М, 


КГ 
1, иначе. 


Элемент Т подобен триггеру, который сигналом (5' &1,) = 1 переключается 
(см. точку «с» на рис. 3.10) в состояние, при котором выходной сигнал 0+1 
становится равным 1, а сигналом 5% = 1 — в состояние, при котором выходной 
сигнал ОЁҒ! принимает значение 0. Переменная 9%, определяется условием 


0, если Р'<О, 


9. = 
1, иначе, 
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где Р‘ есть число единичных сигналов, наблюдавшихся в точке «с» в течение 
предыстории. Константы @ определены для каждого нейрона. 

Векторы Х“, для которых Б, = 1, «обучают» нейрон (число № увеличива- 
ется). Число М для нейрона подобрано так, чтобы № не превысило М за время 
жизни нейрона, если такие векторы Х - суть случайные явления. С другой 
стороны, число № достигнет величины М в случае, если этот вектор есть 
неслучайное явление в системе (с заданной вероятностью ложной тревоги). 
Если событие № = М случится с нейроном п, то мы говорим, что нейрон 
та обучен и образ О., сформирован, начиная с этого момента і. Необратимый 
процесс роста М от 0 до М в нейроне по, есть процесс обучения нейрона Пи, и, 
тем самым, процесс формирования образа О. Если образ сформирован, то он 
не может уже быть «расформирован» (переучивание УС происходит за, счет 
доучивания. Память о прежних образах и знаниях сохраняется в обученных 
нейронах). Сформированный образ может быть распознан в текущий момент 
(ОН = 1) или может быть не распознан (0+! = 0). Несформированный образ 
не может быть распознан. 

Сигнал ОЁҒ! = 1 может быть отключен сигналом 5, = 1 только после того, 
как информация этого сигнала будет использована УС. 

Итак, эта модель нейрона содержит три необратимо обучаемых элемента, 
именно Ви, [и и Съ, и один триггерный элемент Т,„. Выходной сигнал ней- 
рона генерируется на следующем такте после получения входного вектора. 
Поскольку в общем случае нейрон может быть соединен не со всеми нейронами 
предыдущего слоя (рис. 3.8), то прообразом образа, является пространственно- 
временная последовательность сигналов на входе нейросети. Входы данного 
нейрона могут не иметь весов, в этом случае нейрон различает только еди- 
ничные векторы с учетом полноты их состава, задаваемой функцией р(№). 
Нейрон обучается под воздействием единичных (с учетом функции р(№)) вход- 
ных векторов, другими словами, нейрон способен обнаружить коррелирующие 
единичные сигналы, если они подаются на входы нейрона. 

С помощью рассмотренной модели нейрона можно формировать не только 
такие полезные для управления образы, как указанные выше образы перио- 
дических явлений, временных процессов и причинно-следственных явлений. 
Некоторые другие полезные для управления образы, на, наш взгляд имеющие 
аналогии с образами, формируемыми нервными системами, будут показаны 
в разд. 3.2.11 и 3.3.4. 

В заключение этого раздела для того, чтобы читателю была исчерпыва- 
юще понятна работа описанной модели нейрона, в том числе в составе сети, 
представим простой пример, аналогичный примеру на рис. 3.11. Пусть имеется 
фрагмент сети, состоящий из семи нейронов и трех датчиков, соединенных так, 
как это показано на, рис. 3.17. 

Здесь треугольниками изображены датчики, поставляющие в сеть входные 
бинарные сигналы. Пронумерованными кружками изображены нейроны Я. 
Сплошными стрелками показаны выходные сигналы О, нейронов. Пунктир- 
ными стрелками показаны отключающие сигналы Й . Поскольку полагаем, 
что датчики нельзя отключить, то от нейронов 1, 2 и 3 отключающие сигналы 
к датчикам не идут. Сеть работает в дискретном времени, номер такта указан 
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а 1 


Рис. 3.17. Фрагмент сети, состоящий из семи нейронов и трех датчиков 


вверху справа. Если по связи на данном такте проходит единичный сигнал, 
то эту связь будем изображать жирной стрелкой, если сигнал равен нулю — 
тонкой стрелкой. 

Пусть у каждого из нейронов в этом примере константы М и О равны 3. 
Для того чтобы показать, как увеличиваются счетчики № и Р нейронов 
(нас интересует увеличение № и Р от 0 до 3), будем закрашивать кружок 
нейрона серым цветом по секторам: верхняя половинка, нейрона пусть имеет 
три сектора, соответствующих значениям №, а нижняя — два сектора, соответ- 
ствующих значениям Р. Полностью обученный нейрон представлен полностью 
закрашенным кружком. 

Будем подавать на вход сети бинарные сигналы так, чтобы показать, как 
сеть обучается распознавать закономерный прообраз. Закономерным будем 
считать прообраз, представленный таким входным вектором, у которого все 
три единицы появляются одновременно. В основном нас интересует обучение 
нейрона номер 7, поэтому мы будем сразу подавать «закономерный» прообраз 
на вход сети, понимая, что все иные векторы не будут приводить к обучению 
нейрона 7. Полезно также представлять, что данные три датчика и семь 
нейронов являются только фрагментом некоторой большой сети. 

Результаты эксперимента, представим в виде таблицы, в которой запрото- 
колированы входные и выходные сигналы в сети по тактам (табл. 1), и в виде 
потактовой последовательности изображений сети (рис. 3.18). 

Рассматривая таблицу и рисунок, можно видеть, как постепенно обучаются 
нейроны, как обученные нейроны распознают образы и посылают отключаю- 
щие сигналы назад по сети, что приводит к отключению соответствующих об- 
разов меньшего порядка. Отключающий сигнал отключает нейрон независимо 
от входных сигналов. 

Можно видеть, что нейроны 1, 2 и З обучаются в течение тактов 2-4. 
Обучение нейронов 4, 5 и 6 происходит на тактах 5-7, при этом эти нейроны 
обучаются посылать отключающие сигналы на тактах 8 и 9. Нейрон 7 обучался 
на тактах 8-10, а посылать отключающий сигнал — на тактах 11 и 12. 

Примеры срабатывания обученных нейронов можно видеть на такте 15, где 
нейроны 1, 2, 3 распознают свои прообразы, появившиеся на выходах датчиков 
на такте 14. Следует обратить внимание, что нейрон 7 на этом примере не 
имеет отключающего входа, поэтому, однажды распознав образ, этот нейрон 
продолжает сохранять свой выходной единичный сигнал. Однако он каждый 
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Таблица, 1 
Протокол эксперимента с сетью нейронов 
Входные А Отключающие 
Выходные сигналы нейронов 
№ такта векторы сигналы 
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раз после распознавания образа «сигнализирует» об этом своим отключающим 
сигналом, как, например, на такте 16. 

Можно видеть, что в случае, если на входе демонстрируется иной вектор, 
а не прообраз, то его распознавания не происходит. Здесь это проявляется в 
отсутствии отключающего сигнала на выходе нейрона 7 на такте 25. Понятно, 
что если бы до этого момента нейрон 7 был кем-то отключен, то он при этом 
не выдал бы и выходного единичного сигнала (не распознал образ). 


3.2.3. Биологический нейрон 


Выше мы описали основные свойства, которым вынужденно должен отвечать 
биологический нейрон, если следовать тем принятым нами исходным усло- 
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Рис. 3.18. Потактовое изображение сети в процессе эксперимента. Можно просле- 
дить изменяющиеся значения всех входных и выходных бинарных сигналов, а также 
значения счетчиков № и Р в нейронах 
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Рис. 3.18. Продолжение 
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Рис. 3.18. Окончание 


виям, в которых работает нервная система, и тем задачам, которые она должна 
решать. Представленная модель нейрона, соответствует этим основным свой- 
ствам в самом их простом варианте, при ее разработке мы опирались именно 
на выведенные свойства нейрона, а не на биологическое описание нейрона. 
Однако теперь полезно сравнить полученную модель с теми биологическими 
сведениями, которые известны о реальном нейроне. Рассмотрим коротко, что 
же представляет собой биологический нейрон и нервная ткань. 

По форме нервная система и мозг представляют собой сеть, состоящую 
из нейронов, входных полюсов (выходы рецепторов) и выходных полюсов 
(входы исполнителей). По связям — нервным волокнам, информация переда- 
ется однонаправленно в виде более или менее однотипных нервных импульсов 
с конечной скоростью (от 0,2 до 180 м/с в нервных волокнах различного 
типа). Импульсы (спайки) обычно следуют сериями, частотные и временные 
характеристики которых тоже несут информацию. 

Структура нервной сети неоднородна. В ней выделяются специализирован- 
ные подразделы. Имеются фрагменты многослойной нервной сети в некоторых 
подразделах, например в ганглиях, которые на определенном протяжении 
(в направлении распространения сигналов) не связаны с нейронами других 
подразделов. 
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Способность приспосабливаться (в нашей терминологии — адаптивность) 
проявляется в разнообразных механизмах на всех стадиях жизни вида и ин- 
дивида. Приспособление индивида к конкретным условиям существования 
начинается еще в его пренатальный (до рождения) период. В том числе 
формируется и его нервная система. 

В постнатальном (после рождения) периоде на тканевом уровне имеет 
место некоторое уже относительно небольшое перестроение нервной сети — 
достраиваются или деградируют некоторые связи между нейронами, а также 
имеет место естественное разрушение сети из-за отмирания нейронов. (На за- 
вершающей стадии подготовки настоящей книги в Интернете появилась ин- 
формация о том, что процесс рождения новых нейронов и формирования 
нервной сети продолжается на протяжении всей жизни организма [15]. Это 
обстоятельство крайне важно, если оно верно. Оно не отменяет описанных 
в данной книге механизмов адаптации и не противоречит им, но существенно 
облегчает их реализацию, поскольку позволяет частично перенести нагрузку 
«структурного правила» системы распознавания с нейронов на динамически 
изменяемую структуру сети из нейронов. Тем самым нейрон становится проще 
и ближе к нашей модели.) 

На клеточном и органном уровнях в процессе жизнедеятельности орга- 
низма меняется функционирование нервной сети как логического информа- 
ционного устройства. Адаптивность проявляется в основном в способности 
нервной системы изменять способ управления организмом в соответствии 
с накоплением эмпирической информации о свойствах системы. 

Нейрон является весьма сложным функциональным устройством 
(рис. 3.19). В нашем понимании его функционирование состоит в следующем. 
В некоторые моменты времени к синапсам на дендритах и на теле нервной 
клетки подходят нервные импульсы от других нейронов или от рецепторов. 
Синапс, получивший нервный импульс, через некоторое время, равное 
синаптической задержке, передает возбуждение в виде волны деполяризации 
на мембрану тела нейрона. По мембране возбуждение распространяется 
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Рис. 3.19. Схематическое представление биологического нейрона 
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пассивным способом. Поскольку одновременно по клеточной мембране могут 
распространяться возбуждения от нескольких синапсов, то, по-видимому, 
на мембране клетки имеет место некоторая динамическая интерференционная 
картина возбуждений. Пассивный характер распространения возбуждений 
не связан с явлениями рефрактерности, поэтому возбуждения от разных 
синапсов не должны гасить друг друга, как это имеет место в аксоне при 
активном способе распространения возбуждения. В некотором месте мембраны 
клетки на фиксированном удалении от имеющихся синапсов расположен 
аксонный холмик. Если интерференционная картина возбуждений в месте 
аксонного холмика удовлетворяет некоторому определенному условию, то 
в аксонном холмике возбуждается спайк, нервный импульс, который начинает 
распространяться активным способом с определенной скоростью вдоль по 
аксону к его разветвляющимся синаптическим окончаниям. Через конкретные 
временные интервалы, зависящие от длины аксона и его отростков, дубликаты 
спайка достигнут своих синаптических окончаний. Состав и моменты поступ- 
ления нервных импульсов на входы нейрона, условия и момент генерации 
спайка и моменты воздействий спайка на синаптические окончания находятся 
в определенной сложной зависимости. К этому надо добавить, что при возбуж- 
дении нейрона обычно генерируется не один импульс, но серия, цуг импульсов, 
длительность, частота и характер изменения частоты которых несут в себе 
определенную информацию о прообразе, который возбудил данный нейрон. 
Например, известно, что нейрон, связанный с рецепторной клеткой, при его 
раздражении кислотой реагирует серией импульсов (импульсацией) одной 
частоты, а при раздражении щелочью — серией импульсов другой частоты. 
Известно также, что некоторые из синапсов при получении входного импульса, 
работают не на возбуждение нейрона, а на его торможение, т. е. импульс, пере- 
данный на такой синапс, тормозит работу нейрона, блокирует его возбуждение. 

В процессе жизнедеятельности нейрона его функционирование изменяется. 
Один из механизмов этого явления связан с синапсами. Синапс может увели- 
чиваться либо уменьшаться в течение жизни нейрона. Рост или деградация си- 
напса — его так называемая «пластичность», зависит, по-видимому, от частоты 
его использования, аналогично многим биологическим органам. При этом 
может иметь место взаимное влияние функционирующих синапсов. Синапс 
большего размера вносит относительно больший вклад в создание условий 
в области аксонного холмика, необходимых для генерации выходного спайка. 

При активном использовании синапса сигналы, часто приходящие на си- 
напс, влекут увеличение площади синаптического контакта. В результате 
данным синапсом связывается большее число каналов на мембране сомы. 
Известно также, что имеет место явление взаимного стимулирования роста 
одновременно работающих синапсов, что связано с выделением возбужденным 
синапсом медиатора, концентрация которого уменьшается при удалении от 
места расположения синапса на мембране сомы. Если в зоне повышенной 
концентрации медиатора оказывается другой возбужденный синапс, то рост 
последнего происходит ускоренно. 

«Интеллект» описанной в данной работе модели нейрона состоит в спо- 
собности выделять среди всех наблюдаемых им входных сигналов те, кото- 
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Рис. 3.20. Принцип ассоциативного обучения с модулирующим нейроном 


рые приходят одновременно. В нейроинформатике близкое к этому правило 
известно как правило Дональда Хебба [27|, который предположил, что синап- 
тическая связь, соединяющая два нейрона, будет усиливаться, если в процессе 
обучения оба нейрона согласованно испытывают возбуждение либо торможе- 
ние. Однако такое правило нам кажется в целом логически противоречивым, 
поскольку выходной сигнал есть следствие, результат работы нейрона, и не 
может использоваться как причина, аргумент для принятия решений нейро- 
ном. Можно, конечно, придумывать конструкции с обратными связями, но нам 
представляется, что нейрон должен работать в логически простом, прямом, 
индуктивном порядке — от входа к выходу. Более близким нам представляется 
принцип Таутса и Кемпбела [16], которые, изучая нервную систему морской 
улитки, выяснили, что правило Хебба здесь не работает. Напротив, они обнару- 
жили, что для усиления синаптической связи между двумя нейронами актив- 
ность постсинаптического нейрона не обязательна, если на постсинаптическую 
клетку (рис. 3.20) действует некий третий нейрон. Этот третий нейрон они 
назвали «модулирующим». Если одновременно с пресинаптической клеткой 
действует модулирующий нейрон, то усиливается связь между пресинапти- 
ческим нейроном и постсинаптическим нейроном. Такой механизм обучения 
участвует в образовании условных рефлексов и в имплицитном обучении 
(нецеленаправленном обучении под действием окружающей среды). Кроме 
механизма, укрепления связей существует и механизм их ослабления. В этом 
случае сила связи уменьшается, если активность пресинаптического нейрона 
не сопровождается активностью постсинаптического. 

Сравнивая приведенное описание биологического нейрона с выведенной 
нами моделью нейрона, можно найти ряд подтверждений нашей модели. 


1. Можно видеть, что в нашей модели нейрона реализуется принцип Таутса 
и Кемпбела, так как «коллективный синапс» — счетчик Г, увеличивается 
при совпадении входных сигналов, что и обеспечивает обучение нейрона. При 
желании несложно организовать и уменьшение счетчика Г, например, если 
совпадение сигналов долго не наблюдается. 


2. Поскольку размеры синапсов увеличиваются при их использовании, то 
можно говорить, что биологический нейрон представляет собой устройство для 
автоматического накапливания статистики по входным сигналам, что преду- 
смотрено в нашей модели нейрона. Статистика накапливается, как минимум, 
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в виде увеличения размеров синапсов. Однако не следует исключать и возмож- 
ности существования других механизмов накопления и использования инфор- 
мации в нейроне, например, в концентрации некоторых химических веществ, 
в хромосомном коде и т. п. Собственно механизм накопления информации для 
нас представляет второстепенный интерес. 

Отмеченное свойство ускоренного роста нескольких синапсов в случаях, 
когда на них одновременно приходят входные импульсы, и является, по- 
видимому, основным биологическим механизмом поиска коррелирующих со- 
бытий. Напомним, что в выведенной нами модели нейрона статистика по про- 
образу увеличивалась в счетчике — элементе Г (рис. 3.10) всякий раз, когда по 
всем входам нейрона приходили единичные сигналы. Тем самым, наша простая 
модель нейрона выделяла только прообраз, проявлявшийся в коррелирующих 
(приходящих одновременно) сигналах на всех входах. Однако в реальном 
нейроне может быть до тысячи входов, и такой коррелирующий вектор очень 
маловероятен. Поэтому нейрон ищет корреляции не всех, а только нескольких 
входов, но не любых (вряд ли нейрон почувствует корреляцию двух сигналов, 
поступающих на противоположные участки обширного дендритного дерева), 
а только тех, которые находятся недалеко друг от друга, и «видят» друг друга, 
т.е. формально — удовлетворяют некоторому «структурному правилу» близо- 
сти в метрическом пространстве. Ниже мы представим модель, где это правило 
сформулировано в виде «колоколообразного поля зрения» вокруг каждого 
синапса. По-видимому, физически это правило реализуется с помощью хи- 
мического медиатора, выделяющегося синапсом при получении им сигнала 
и диффузно распространяющегося вокруг синапса на некоторое расстояние. 
Это явление фактически обеспечивает нейрону возможность выделять кор- 
релированно работающие синапсы, т.е. неслучайные входные векторы или 
неслучайные фрагменты входных векторов. Данное свойство нейрона мы и 
рассматриваем как его способность формировать образы. 


3. В некоторый момент увеличивающиеся синапсы достигают таких раз- 
меров, что поступление на вход нейрона соответствующего им неслучайного 
вектора способно вызвать деполяризацию нейрона, достаточную для возбуж- 
дения спайка. Данное свойство можно интерпретировать как способность 
нейрона распознавать сформированный образ. Переход нейрона в обученное 
состояние происходит при переходе количества (размеров синапсов) в новое 
качество — когда при получении входного вектора увеличившиеся синапсы 
в совокупности становятся способными создать возбуждение, достаточное для 
генерации спайка. К сожалению, мы не имеем экспериментального наблюдения 
этого очень важного явления — перехода нейрона из необученного в обучен- 
ное состояние. Возможно, что биологи не придают этому явлению должного 
внимания и исследуют нейрон в одном из его сравнительно долговременных 
состояний — либо в необученном, либо в обученном. 


4. Следует думать, что продолжение роста синапсов далее приводит к та- 
кой ситуации, когда нейрон будет возбуждаться и тогда, когда данный век- 
тор будет подан не полностью. Это дает возможность нейрону распозна- 
вать образ в условиях помех в прообразе, а также тогда, когда демонстра- 
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ция пространственно-временного прообраза еще не закончилась во времени, 
т.е. возникает важная возможность предсказывать еще не наступившие со- 
бытия. Мы тоже не имеем пока экспериментального подтверждения этого 
свойства нейрона, кроме наблюдения этого свойства в поведении организмов. 


5. Функционирование нейрона регламентировано во времени. Имеют место, 
например, определенные синаптические задержки, задержки прохождения 
импульсов по аксону и его отросткам, задержки прохождения импульсов по 
дендритам и по мембране сомы, а также другие временные характеристики 
сигналов, от которых зависит генерация результирующего спайка. Мы по- 
лагаем, что учет времени в работе нейрона имеет принципиально важное 
значение, потому что время дает возможность обнаруживать и учитывать 
причинно-следственные связи событий. В нашей модели мы ввели время, хотя 
и в самом простом виде — срабатывание нейрона требует одного такта времени. 


6. Прообраз сформированного образа (входной вектор, вызвавший обучение 
данного нейрона) есть определенное пространственно-временное явление. 

Пространственный аспект прообраза связан с фиксированными положе- 
ниями синапсов и аксонного холмика на мембране тела нервной клетки, 
а также с постоянством структуры связей нервной сети (с учетом возможно- 
стей достройки сети). Тот факт, что биологическая нервная сеть не является 
полносвязной, даже в отношении нейронов соседних слоев, очень важен, так 
как позволяет адресовать распознаваемые сетью объекты и события просто 
положением распознающих их нейронов в сети. Временной аспект прообраза 
связан с существованием временных задержек, указанных здесь в п. 4. 


Итак, мы полагаем, что предложенная нами модель нейрона соответствует 

простому частному случаю биологического нейрона. А именно: 

— Нейрон может сформировать образ только тогда, когда коррелируют 
(поступают одновременно) не менее чем р входных сигналов (см. 
рис. 3.16), а элемент Г представляет собой просто один обобщенный 
синапс, который играет роль «статистического правила». Развитие этой 
модели в направлении усложнения «структурного правила» для эле- 
мента В, описывающего, корреляции каких именно входов может чув- 
ствовать нейрон, с использованием индивидуальных для каждого входа, 
статистических счетчиков — синапсов, будет представлено ниже. 

— Нейрон может распознавать сформированный образ, в том числе при 
наличии помех. 

— Нейрон может предсказывать наступление будущих повторяющихся со- 
бытий. 

— В рассмотренной модели нейрона учитываются временные задержки, 
хотя и в простой форме. А именно, все временные задержки в нейроне 
представлены в одной временной задержке — такте срабатывания ней- 
рона. 

— Нейрон имеет тормозящий синапс, представленный входом 5. 

— Выходная импульсация нейрона представлена длительным единичным 
сигналом, продолжительность которого ограничивается поступлением 
сигнала на тормозящий синапс 5. 


3.2. Синтез распознающей системы 141 


Как будет показано ниже, даже в этой сравнительно простой форме наша, 
модель нейрона может иметь большое практическое значение, и на ее основе 
могут быть построены разнообразные практические прикладные системы. 

Естественное желание усовершенствовать разработанную модель нейрона 
и внести в нее еще большее подобие биологическому нейрону отразилось 
в том, что нами были разработаны еще несколько более продвинутых моделей 
нейрона, в которых, однако, за большее биологическое правдоподобие при- 
ходится расплачиваться большей вычислительной сложностью. Эти модели 
расширяют арсенал разработчика прикладных систем и дают ему возмож- 
ность выбирать модели нейронов, адекватные конструируемым прикладным 
системам. 


3.2.4. Модель нейрона типа П 


Возможно, что в некоторых приложениях модель нейрона типа І покажется 
неудобной, например, тем, что на выходе этого нейрона надо поддерживать 
длительный единичный сигнал (или пуг импульсов), которые служат крат- 
ковременной памятью и сигнализируют о том, что был распознан образ, 
до тех пор, пока этот сигнал не будет востребован другим нейроном. При 
этом отключение выходного сигнала нейрона производится внешним сигналом, 
подаваемым на тормозящий вход нейрона. Выходной сигнал нейрона типа І 
соответствует по смыслу сигналу от «тонического» датчика, поскольку на- 
блюдатель этого сигнала может сказать, что определенная ситуация имеет 
место (ее образ распознан), и в данный момент она уже не изменяется, 
но чтобы знать, когда именно произошло распознавание, нужно было следить 
за началом этого сигнала. 

Для того чтобы устранить неудобства нейрона типа І и при этом заставить 
нейрон работать в режиме «фазического» датчика, т. е. передавать информа- 
цию только об изменении ситуации, мы разработали вторую модель нейрона, 
названную нами нейроном типа П. В этой модели длительный сигнал, игра- 
ющий роль оперативной памяти, и отключающий его тормозящий сигнал ока- 
зываются внутренними функциями нейрона, а вся модель получается простой 
рекомпозицией элементов нейронов в их сети. 

Возьмем сеть (рис. 3.21), состоящую из трех инцидентных нейронов типа І: 
ті, по и пз. Теперь уберем границы нейронов и новую границу нейрона прове- 
дем так, чтобы она рассекала только связи между точками «с» и триггерами 
нейронов (см. также рис. 3.10). Будем теперь называть нейроном композицию 
из элементов, которая закрашена серым на рис. 3.21. 

У этой модели нейрона выходным является сигнал «с», который представ- 
ляется не цугом импульсов, а только одним импульсом, а все отключающие 
связи и сигналы теперь заключены внутри нейрона. Между нейронами теперь 
импульсы движутся только в одном направлении. Понятно, что такой нейрон 
может иметь не два, как на рисунке, но много входов. 

Теперь логика работы нейрона несколько иная. Нейрон получает на вход 
двоичный вектор из коротких единичных и нулевых сигналов. Каждый такой 
импульсный сигнал включает свой триггер Т, который начинает поддержи- 
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Рис. 3.21. Рекомпозиция подсистем нейронов типа І в модель нейрона типа П 


вать на своем выходе некий постоянно высокий сигнал. Сигналы от всех 
триггеров собираются на распознающем элементе К. Если элемент В сочтет, 
что данная комбинация сигналов удовлетворяет правилу В (например, это 
логическое «И»), то он выдаст импульсный сигнал на счетчик Г. Счетчик Г 
набирает статистику по данному образу. Когда элемент Г, обучится, он начнет 
пропускать импульсный сигнал от элемента В через точку «с» на выход 
нейрона. От точки «с» единичный сигнал, после прохождения через элемент 
С, будет поступать на триггерные элементы Т и сбрасывать их. Биологиче- 
ская интерпретация постоянного сигнала, на выходе триггерного элемента Т 
в нейроне П (оперативная память нейрона) становится более естественной. 
Она может быть связана, например, с концентрацией какого-либо вещества, 
с шириной и скоростью прохождения волны деполяризации в месте аксон- 
ного холмика, а также с другими причинами, определяющими характерную 
длительность импульса, воспринимаемого элементом В как единичный сиг- 
нал. Будем полагать, что единичный выходной сигнал у; = 1 триггерного 
элемента Т; поддерживается не дольше, чем в течение времени т;, но обя- 
зательно прекращается в случае генерации выходного сигнала сі! 
обеспечивает регенерацию распознающих свойств нейрона. 


= 1, что 


Элемент накопления статистики Г, в нейроне типа [ был необходим для 
организации обучения при принятии решений, о чем будет сказано ниже при 
рассмотрении Базы Знаний. В модели нейрона типа П эти функции частично 
будут выполнять триггерные элементы Т и элементы задержки Р (рис. 3.22), 
поэтому элементы С можно в данной модели опустить. Рассмотрим функции 
элементов ДВ и Т. 

Если обратиться к биологическому нейрону, то очевидно, что в его работе 
важную роль играют временные задержки и временные характеристики сиг- 
налов. Всякий импульсный процесс может быть описан с использованием боль- 


3.2. Синтез распознающей системы 143 


синхроимпульс +! 


Рис. 3.22. Модель нейрона типа П 


шого числа временных характеристик, описывающих как временной профиль 
отдельного импульса, так и временные и частотные характеристики последова- 
тельностей импульсов. Например, большое значение временным характеристи- 
кам профилей нервных импульсов придается в теории так называемых «спай- 
ковых» нейронов [17]. Однако в настоящей работе мы представляем импульс 
прямоугольным временным профилем, а серию импульсов — протяженным 
прямоугольным временным профилем, и полагаем, что импульсы перемеща- 
ются по нервным волокнам мгновенно, а временные задержки осуществля- 
ются только в срабатывании нейрона. При таком представлении импульсной 
активности нейрона нам представляется важным смоделировать две харак- 
теристики импульсной активности в реальной сети биологических нейронов. 
Первая из них — это относительные временные задержки прихода разных 
импульсов к узлу слияния. Например, пусть по нескольким нервным волокнам 
от разных источников к биологическому нейрону подошли три импульса, воз- 
буждение от которых одновременно (в момент #2) достигло аксонного холмика 
(рис. 3.19). Очевидно, что каждый из импульсов преодолел свой собственный 
специфический путь от своего источника до аксонного холмика, характери- 
зующийся своими временными задержками, в числе которых были: время 
прохождения по нервному волокну (аксону) определенной длины и с опре- 
деленной скоростью, синаптическая задержка, время распространения волны 
деполяризации по определенной длины дендриту и по мембране сомы нейрона. 
Для того чтобы данные импульсы одновременно достигли аксонного холмика, 
требовалось, чтобы из своих источников они вышли со строго определен- 
ными относительными временными задержками. Поскольку перечисленные 
физико-морфологические характеристики каждой пары источник-приемник 
(аксонный холмик — аксонный холмик двух инцидентных нейронов т; и т;) 
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остаются, по-видимому, постоянными, суммарную временную задержку каж- 
дой такой конкретной пары (+, 7) можно характеризовать одной величиной Д;; 
и представить ее одним элементом задержки Р,;, который можно расположить 
на 1-м входе нейрона (рис. 3.22). Изменяя величину такой задержки, можно 
регулировать время прихода возбуждения от нейрона-источника к решающей 
части (к аксонному холмику) нейрона-приемника. 

Как было сказано, выходная активность нейрона может быть представлена, 
не одним импульсом, но серией импульсов, занимающих некоторое время т. 
Тем самым при представлении серии импульсов одним протяженным прямо- 
угольным импульсом нужно учитывать протяженность т такого импульса. Эту 
протяженность во времени можно назвать также «периодом актуальности» 
данного импульса. Период актуальности импульса может отражать не только 
длину серии выходной импульсации нейрона, но также, например, ширину 
зоны возбуждения, которая начинает распространяться по мембране клетки 
при получении ею возбуждения от синапса. Эта зона, как можно предполо- 
жить, может быть широкой или узкой, что зависит, например, от расстояния 
между синапсом и аксонным холмиком. Если решающая часть нейрона (аксон- 
ный холмик) начинает реагировать только тогда, когда соберется некоторый 
полный комплект импульсов, то моменты прихода протяженных импульсов мо- 
гут соответствующим образом опережать моменты прихода других импульсов. 

Введение периодов актуальности импульсов порождает неопределенности 
моментов поступления импульсов на входы нейрона. С учетом задержек А; 
и т; получаем, что, если на выходе обученного нейрона в момент # появился 
единичный сигнал, то единичные импульсы на входы нейрона поступили 
в интервалы времени 


Неопределенность моментов поступления входных импульсов будет тем 
меньше, чем меньше задержки т;. 

Пример временной диаграммы работы обученного нейрона типа П с двумя 
входами и с заданными задержками Ду = 6, Д> = 4, т = З и т» = 2 показан 
на рис. 3.23. Вопросительными знаками отмечены неопределенности моментов 
прихода входных импульсов, соответствующие интервалам ;. 

Различное отношение и расположение задержек А; т; и интервалов неопре- 
деленностей 4; во времени наделяет нейрон типа П возможностями формирова- 
ния и распознавания образов следующих основных видов, которые существуют 
в природе. 


1. Если П 4; 2 ©, т. е. необходимые интервалы неопределенностей входных 
импульсов пересекаются во времени, то имеем образ пространственного про- 
образа (например, рис. 3.24 (а)). В этом прообразе неважно, какая из состав- 
ляющих появилась первой, какая — последней, важно только наличие всех 
составляющих. Например, это образ некоторой геометрической фигуры, где 
были распознаны образы всех ее необходимых составляющих. 


2. Если П 4; = ©, то имеем образ следования. В прообразе этого образа 
важен именно порядок следования образующих, допустима неопределенность 
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Рис. 3.23. Пример временной диаграммы входных и выходного импульсов нейрона 
с двумя входами, учитывающего временные задержки и длительности импульсов 
(нейрон типа П) 
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Рис. 3.24. В зависимости от допустимых периодов неопределенности прихода им- 
пульсов различают образы «пространственных» прообразов (а), образы «следовал 
ния» (6), образы «пространственно-временных» прообразов (в) 


в конкретных моментах прихода импульсов (рис. 3.24 (6)). Примером может 
быть распознавание напечатанного многозначного числа — неважно, каковы 
интервалы времени между распознанными цифрами, важна именно последо- 
вательность распознаваемых цифр. 

Если Үт; = 1, то имеем образ пространственно-временного прообраза. 
В прообразе однозначно определено, по каким входам и в какие моменты вре- 
мени приходили сигналы (рис. 3.24 (в)). Примером может быть распознавание 
музыкального тона определенной высоты. 

Посредством образов пространственных, временных и следования можно 
описать очень широкий класс прообразов. 

Мы не знаем, заданы ли в биологических нейронах задержки А; и т; 
изначально, или их величины изменяются и приспосабливаются в процессе 
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Рис. 3.25. Если нейрон пз имеет разные задержки на задействованных входах, то 
возможно, что реальная задержка между сигналами х1 и т2 будет обнаружена 


жизни нейрона. Если значения задержек заданы изначально, то нейрон сфор- 
мирует образ при совпадении его задержек и реальных задержек прообраза. 
Возможно, что этим объясняются такие конструкции в нервных сетях, когда 
два нейрона связаны друг с другом множеством связей. Если эти связи имеют 
разные временные задержки, то они просто представляют собой некое поиско- 
вое пространство, в котором методом проб и ошибок находится та пара, у ко- 
торой задержки совпадают с реальными задержками сигналов. На рис. 3.25 
показана нейронная конструкция из трех нейронов, способная обнаружить, что 
два сигнала, х и 12, следуют из их источников друг за другом с определенной 
постоянной задержкой, если искомая задержка совпадает с задержками одного 
из пробных соединений двух нейронов. 

Очевидно, что при синтезе нейроноподобных систем управления необхо- 
димое число пробных соединений и нейронов такого типа в подсистеме фор- 
мирования и распознавания образов (ФРО) будет тем меньше, чем больше 
априорной информации о временных характеристиках прообразов известно 
на стадии синтеза сети. 

Можно предположить, что существуют механизмы нахождения оптималь- 
ных пробных временных задержек на конкретных парах нейронов, имеющих 
множественные соединения, чтобы максимально повысить вероятность нахож- 
дения реальных задержек между сигналами и ускорить это нахождение. 

Обнаружение реальных задержек между событиями очень важно при 
управлении организмом, особенно при управлении движением органов тела 
в процессе выполнения операций, которые требуют жесткого согласования по 
времени. Например, чтобы животное могло успешно перепрыгивать через ямы, 
требуется, чтобы его система управления нашла очень точно согласованные во 
времени движения мышц и работу сенсоров. 

Еще раз подчеркнем, что выходной сигнал нейрона типа П по смыслу более 
соответствует показаниям «фазического» датчика, потому что этот единичный 
сигнал указывает на то, что распознавание образа произошло именно в данный 
момент, т.е. ситуация изменилась, и изменилась именно в момент, предшеству- 
ющий данному сигналу. 

Как и нейрон типа І, нейрон типа П способен, при снижении порога р(М№) 
ниже 1, к распознаванию образа при наличии помех и пропусков во входных 
данных, а также к предсказанию входной закономерной информации. 
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Поскольку нейрон типа П требует более четкой синхронизации во времени, 
то целесообразно согласовать работу нейрона с синхроимпульсами посред- 
ством логического элемента «И», который мы ввели в выходную часть модели 
нейрона. 

Приведем формализм нейрона типа П: 


НТ +10, р. 
О = Е 


НЕ рЕ+1 0,741. 
Си = 01, 421, ) 
бой 
У 
а 
БЕРІ = 4 1, если — 5 д) 


0, иначе; 
где р (№) — убывающая сигмоидальная функция; 


ТАЁ 6; 
У; = јо, баз; 


Р І, если р, Є а; = Е А; ТЕ Д; 1, 
"|0, иначе; 


где 1р; = 1 | Т = 1 — момент импульса на входе 1х; 


_ =, если М> М, 
Б 0, иначе; 


№ = 0; 
М = № +6. 


3.2.5. Нейрон как система распознавания 


Как и для нейрона типа І, возможности нейрона типа П по формированию 
и распознаванию образов определяются возможностями элементов В и Г. 
Именно в этих элементах мы сосредоточиваем распознающие способности 
нейрона. При этом элемент Г, можно было бы рассматривать как часть рас- 
познающего алгоритма, т.е. как часть элемента №. Мы вынесли элемент Г 
из элемента АВ только для того, чтобы акцентировать внимание на том, 
что самообучаемый распознающий алгоритм нейрона использует накопление 
статистики, причем мы сосредоточили этот накопитель в одном месте — 
в элементе Г, хотя в биологическом нейроне роль такого накопителя осу- 
ществляется, скорее всего, несколькими подсистемами. В элемент В можно 
«зашить» любой подходящий для конкретного случая алгоритм автоматиче- 
ской классификации и распознавания, а не только тот, который был описан 
выше. При конструировании прикладных систем выбор метода распознавания 
ограничен только прагматическими соображениями. А при моделировании 
биологических нейронов надо, во-первых, иметь в виду, что существуют биоло- 
гические нейроны разного типа, отличающиеся и своим строением (например, 
число входов у разных нейронов может быть разным — от нуля до тысячи), 
и своими функциями, поэтому можно предположить, что различные нейроны 
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имеют алгоритмы распознавания различной мощности. Возможно, что про- 
стейшие нейроны работают как генератор случайных воздействий или как 
простое передаточное звено, или как элементы задержки. Простые нейроны 
могут работать как логические схемы совпадения «И» или схемы объединения 
«ИЛИ». Но наиболее сложные нейроны, по нашему убеждению, являются 
весьма сложными системами автоматической классификации, или самообуча- 
емыми системами распознавания, способными обнаруживать разнообразные 
корреляции сигналов среди большого потока случайных сигналов на своих 
многочисленных входах. Важно, что многие из перечисленных качественно 
разных функций биологических нейронов можно реализовать с помощью 
рассмотренных моделей, если вносить в них количественные изменения пере- 
менных параметров. Например, изменяя величину порога, р в распознающем 
элементе А нейрона от 1 до 0, можно превращать нейрон последовательно в 
подобие логического элемента «И», в пороговый элемент «ИЛИ», в элемент 
«ИЛИ», в генератор случайных чисел. Ниже мы покажем, что если добавить 
к нейрону различные виды синапсов, то мы получим очень широкий по своим 
возможностям «элементный базис», конструктор, из которого можно строить 
самые разнообразные логические и вычислительные схемы. 

Надо также отметить, что для построения действующих моделей нервных 
систем вовсе не обязательно использовать максимально правдоподобные мо- 
дели нейронов, аналогичные по вычислительной мощности реальным наиболее 
сложным нейронам. С сохранением сути модели можно построить ее и на более 
простых элементах и даже заменить определенные нейронные конструкции 
программными «заглушками», выполняющими те же функции каким-то иным 
способом. 

Развитие функциональных возможностей модели нейрона связано, как 
было сказано выше, прежде всего с развитием элемента В — основной рас- 
познающей подсистемы нейрона. В рассмотренных моделях нейронов типа І 
и П элемент А представлял собой по сути пороговый сумматор: если сумма 
поступивших на его вход единичных сигналов превышала текущее значе- 
ние порога р, то элемент В распознавал образ и сигнализировал об этом 
единичным выходным сигналом. Вопрос о статистической значимости этого 
образа решался статистическим счетчиком Г, подсчитывающим число фактов 
наблюдения такого образа и при накоплении достаточной статистики регистри- 
ровавшим в памяти формирование нового образа, в дальнейшем разрешая его 
распознавание. 

Если рассматривать нейрон типа [ как систему автоматической класси- 
фикации, то его признаковое пространство имеет размерность т+1, где т 
измерений бинарные и соответствуют компонентам т-мерного бинарного 
вектора Х входных сигналов, а (т + 1)-е измерение целочисленное — 
это число №. В начальный момент № = 1. Правило образования класса 
(формирования образа) состоит в следующем. В т-мерном подпространстве 
Х описывается некоторая окрестность точки (1,1,...,1), удовлетворяющая 
правилу р (число единиц в векторе Х должно быть не меньше значения 
р(№), где р(№) — заданная функция). Если наблюдаемый вектор попа- 
дает в указанную окрестность, то № увеличивается на 1, а такой вектор 
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Рис. 3.26. Область в признаковом пространстве нейрона, которая соответствует 


распознаваемым нейроном образам, образована окрестностью точки (1,1,...,1), вы- 
тянутой вдоль статистического параметра №, от значения № = М до конца жизни 
нейрона 


называется непосредственным прообразом. Окрестность непосредственного 
прообраза вытягивается в (т + 1)-мерном пространстве вдоль оси №, при 
этом площадь т-мерного сечения окрестности изменяется с ростом № 
(например, если функция р(№) есть убывающая сигмоидальная функция, 
то площадь К-мерного сечения асимптотически увеличивается). Множество 
всех непосредственных прообразов при всех № > М, где М — заданная 
константа, и образует в пространстве признаков ту область, которая является 
описанием класса — образа, который может распознаваться данным нейроном 
как системой распознавания. Эту область можно попытаться представить 
(рис. 3.26) как асимптотически расширяющийся вдоль оси № усеченный 
гиперконус, ограниченный с узкой стороны сечением при № = М, а с широкой 
стороны — некоторым предельным №мһах, равным времени жизни нейрона. 

Измерение № в признаковом пространстве нейрона типа І можно назвать 
статистическим измерением. Его наличие в модели отражает осознанную 
нами необходимость того, чтобы нейрон обучался по мере накопления им 
уверенности в том, что явление, которое он должен запомнить, является 
неслучайным в системе. В описанном выше варианте нейрона «неслучайность» 
прообраза мы характеризуем очень простой величиной — числом № его на- 
блюдений. Содержательный пример — если среди встречаемых нами на улице 
людей некоторый человек встречается неоднократно, М > 1, то при некоторой 
очередной встрече, № = М, мы его узнаем, и будем узнавать далее при всех 
последующих встречах, № > М. При увеличении числа встреч с прообразом 
мы начнем его узнавать даже при наличии помех, допустимое число которых 
может увеличиваться тем больше, чем большее число раз мы встречаемся 
с данным прообразом. Рост допустимого числа помех мы определяем моно- 
тонным ростом величины 1/р. 

Очевидно, что предлагаемый подход не есть единственно возможный способ 
учета числа встреч с прообразом при формировании его образа. Например, как 
уже говорилось, наш нейрон не забывает со временем однажды сформирован- 
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ный образ. Это сделано потому, что по нашему убеждению процессы запоми- 
нания и забывания информации в нервной системе отнюдь не симметричны по 
нескольким причинам. Найти знания в этом мире трудно, для поиска новых 
знаний создан весь организм со всеми его системами, и каждый сформирован- 
ный образ ценен, при условии, что он достоверен, и его желательно сохранить. 
Забывать достоверные образы слишком расточительно. Поэтому забывание 
информации в идеальном случае может быть вызвано только поломкой ее 
носителей, отмиранием нейронов. 

Однако можно указать несколько тактических причин, по которым нейрон 
мог бы забывать информацию. Во-первых, критерий формирования образа, 
состоящий просто в подсчете числа № наблюдений прообраза, не достаточно 
правилен, поскольку его обоснование должно быть сделано через энтропию 
информации опытов взаимодействия управляющей системы со средой. А в по- 
нятие энтропии входит вероятность появления прообраза. Вероятность свя- 
зана, прежде всего, с частотой встречаемости прообраза, и только последняя 
может быть выражена через число наблюдений прообраза и число тактов вре- 
мени жизни системы. Поэтому более правильно было бы основывать правило 
формирования образа на понятии частоты встречаемости прообраза. Конечно, 
для оценивания частоты потребовалась бы лишняя память, большая, чем 
для оценивания просто числа наблюдений. Промежуточным по сложности 
решением могло бы быть оценивание скважности следования фактов наблю- 
дения прообраза, и если скважность оказывается ниже некоторого порогового 
значения, полагать образ сформированным (скважность сигнала — это отно- 
шение длины периода к длине сигнала). Физико-биологическим механизмом 
реализации такого «правила» могло бы быть накопление в нервной клетке 
порции некоторого ресурса при получении сигнала о наблюдении прообраза, 
с последующим постепенным расходованием этого ресурса во время паузы 
между распознаваниями. Если в этих условиях нейрону удастся накопить опре- 
деленное пороговое количество ресурса, образ будет сформирован. Если же 
паузы между наблюдениями прообраза слишком велики и накопленный ресурс 
успевает растратиться, то образ не формируется. В этом случае даже сформи- 
рованный образ может быть забыт, если его прообраз перестал наблюдаться 
системой. Соответственно можно изменить функции ри, и [,, сделать их аргу- 
ментом не число № наблюдений непосредственного прообраза, а скважность 
наблюдений или частоту на некотором текущем временном окне или что-либо 
подобное, так, чтобы нейрон начинал забывать прообраз, если тот стал реже 
наблюдаться — сначала уменьшалось бы допустимое для распознавания число 
помех (возрастало р), а потом нейрон и совсем переставал бы распознавать 
образ (уменьшение значения счетчика Її, вплоть до значений № < М). 

Из приведенного выше описания нейронов типов І и П понятно, что и тот, 
и другой нейрон нельзя назвать распознающей системой без обучения, потому 
что в своем исходном состоянии нейрон не будет распознавать образ даже при 
предъявлении ему непосредственного прообраза. Распознавание образа станет 
возможным только после выполнения заданного условия — когда число № 
превысит константу М, что соответствует накоплению статистической инфор- 
мации. Следовательно, нейрон типа І является обучаемым, а поскольку обуче- 
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ние осуществляется нейроном самостоятельно без внешнего учителя, то нейрон 
типа І можно характеризовать как самообучаемую систему распознавания, для 
которой правило формирования класса определено нами выше. 

Понятно, что один нейрон как типа І, так и типа П связан только с одним 
классом (образом). Тем самым, каждый нейрон соответствует проверяемой 
гипотезе о существовании одного образа с заранее определенными парамет- 
рами (с точностью до пороговой величины р). Вся сеть из нейронов типа І или 
типа П является совокупностью гипотез — пробных образов, и когда некоторые 
нейроны обучаются, то тем самым некоторые из гипотез — пробных образов, 
становятся действительными образами. Поэтому сеть нейронов типа І или П 
также является самообучаемой системой распознавания. 

В нейроне типа П сначала объект представлялся в (т + 2) — мерном 
пространстве из К координат вектора Х, одной статистической координаты № 
и одной временной координаты. Затем с помощью элементов временной за- 
держки объект отображался в (т + 1)-мерное пространство, аналогичное 
нейрону типа І, и далее применялся тот же алгоритм, что и у нейрона типа І. 

Понятно, что в (т + 2)-мерном пространстве признаков нейрона как си- 
стемы распознавания можно предложить различные алгоритмы формиро- 
вания и распознавания классов — образов. Так, особенно при больших Ё, 
целесообразно было бы, чтобы нейрон проверял не одну гипотезу об одном 
конкретном образе, как в случае нейронов типа І или П, но мог бы проверять 
некоторое множество гипотез. В нейронах Ги П центром единственного про- 
веряемого класса исходно задавалась точка (1,1,...,1). Однако вполне можно 
предложить иные правила автоматической классификации, когда, один нейрон 
мог бы проверять множество классов. За основу такого правила можно было 
бы, в идеальном случае, взять правило, соответствующее нахождению корре- 
лирующих во времени сигналов, т.е. попросту применить расчет взаимных 
корреляций всех сигналов, а еще лучше — со всеми мыслимыми временными 
задержками. В случае успеха такой нейрон мог бы, например, найти, что 
некоторые отдельные точки в разных сторонах признакового пространства по- 
являются каждый раз в определенном порядке с определенными временными 
задержками. Однако нахождение даже попарных корреляций всех т х т сиг- 
налов при более или менее больших т требует расчетов и хранения в памяти 
нейрона слишком больших матриц. Поэтому нейрону приходится ограничи- 
ваться анализом только некоторых более простых правил. Например, нейрон 
может обнаружить в признаковом пространстве-времени компактный кластер, 
не выходящий за пределы сферы некоторого радиуса (рис. 3.27). В терми- 
нах входных импульсов нейрона это может выглядеть как обнаружение того 
факта, что несколько импульсов приходят на определенные близко друг от 
друга расположенные синапсы одновременно. 

Возникает еще такой вопрос — сколько образов должен уметь распознавать 
один нейрон? Пусть нейрон является системой распознавания, которая может 
распознавать К образов. При решении им задачи распознавания нейрон 
должен передать другим нейронам по сети информацию о результатах распо- 
знавания, которые состоят в том, что сообщается, к какому классу относится 
предъявленный вектор сигналов на входе, т.е. который именно образ из К 
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Рис. 3.27. Формирование образов нейроном в многомерном пространстве-времени 
при образовании кластеров 


распознан. Но у нейрона не много возможностей передать такую информацию. 
Через один-единственный выход, которым располагает нейрон, он может 
передать только серию импульсов, частотные характеристики которой могут 
варьировать не в слишком широких пределах. Как уже упоминалось выше, 
известно, например, что нейрон рецепторной клетки реагирует одной частотой 
импульсов на раздражение кислотой, а другой частотой — на раздражение 
щелочью. Поскольку для управления очень важна информация о том, 
какие именно образы распознаются, то емкость алгоритма распознавания 
нейрона должна соответствовать множеству различимых идентификаторов 
для алфавита классов (множества, образов), которые нейрон может передать 
по своей выходной связи. Поскольку возможности нейрона идентифицировать 
распознанные им образы не очень широки, то отсюда следует, что нейрон 
распознает не много образов, скоре всего — один или несколько. Тем самым, 
важно, чтобы нейрон мог обнаружить кластер в любом месте признакового 
пространства, т. е. мог проверить несколько гипотетических образов. Однако 
научиться распознавать он должен только один такой кластер, поскольку 
нейрон не сможет передавать на выход информацию о том, какой именно 
из нескольких кластеров он распознал. Основным способом идентификации 
образов является само «географическое» положение нейрона в сети. Нервная 
система, «увидев» импульсацию определенного нейрона, уже по одному 
этому факту должна «понимать», что она обозначает, а не анализировать 
содержание этой информации. Хотя, безусловно, имеют место оба этих способа 
прочтения информации от активизировавшегося нейрона. Так, если частота, 
выходного сигнала нейрона может кодировать сообщение о том, какой именно 
из нескольких кластеров был распознан, то, следовательно, нейрон должен 
научиться распознавать несколько разных кластеров. 

Если предлагаемая модель нейрона как самообучаемой системы распо- 
знавания верна, то это означает, что при исследованиях и моделировании 
нейронов следует просто найти близкие по смыслу алгоритмы самообучения 
распознаванию и реализовать их в моделях нейронов. Здесь основная проблема 
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может состоять в отождествлении параметров алгоритмов распознавания, 
близких к тем, которые выполняет нейрон, и в их реализации в модели. Может 
оказаться, что подходящий алгоритм имеет слишком большую вычислитель- 
ную сложность, для реализации функции нейрона понадобится небольшой 
микропроцессор с большой памятью, а искусственная нейроноподобная сеть 
окажется трудно реализуемой и дорогой. В этом случае придется решать 
оптимизационные задачи и искать оптимальные и приемлемые по сложности 
алгоритмы. 


3.2.6. Модель нейрона типа Ш 


В качестве примера того, как в модели нейрона можно использовать более 
эффективный (но одновременно и более сложный) алгоритм распознавания, 
рассмотрим алгоритм работы нейрона, предложенный А. Рядовиковым и пред- 
ставленный в работе [14]. Если нейроны типов Ги П способны проверить 
только одну гипотезу — существует ли прообраз, расположенный в одной 
заранее определенной области пространства признаков, то нейрон типа Ш 
проверяет множество гипотез, соответствующих большому множеству обла- 
стей пространства признаков, удовлетворяющих некоторому правилу. Первая 
подтвержденная гипотеза, считается образом, и на этом поиск образов данным 
нейроном прекращается. Данный нейрон удобно использовать в следующем 
случае. Пусть имеется параметрическое пространство, в котором расположены 
заранее неизвестные кластеры (образы), которые надо обнаружить. Если ис- 
пользовать нейроны типа І или П, то придется это пространство разбивать 
на множество пробных подпространств (гипотез), каждое из которых связы- 
вать с нейроном и проверять, существует ли в нем неслучайный прообраз. 
Если же удается отделить в исходном пространстве область, про которую 
известно, что в ней существует только один прообраз, хотя и неизвестно точно 
в каком именно месте этой области, то здесь удобно использовать нейрон 
типа ПІ, подав на него всю отделенную область, и нейрон типа Ш найдет 
этот прообраз. Правда, при этом прообраз тоже должен удовлетворять опре- 
деленным условиям — его составляющие должны быть близки друг к другу 
в определенной метрике. В этом случае один нейрон типа Ш способен заменить 
собой множество нейронов типа І, а это важно для сокращения объема сети 
нейронов в прикладных системах. Если же в области пространства признаков, 
подаваемой на нейрон ПІ, находятся несколько прообразов, то все они, кроме 
первого, не будут найдены, и в этом случае применение нейрона типа Ш может 
оказаться нецелесообразным. 

Модель нейрона типа Ш использует тот факт, что у биологического ней- 
рона особенно быстро растут те синапсы, на которые входные сигналы посту- 
пают одновременно. Нам представляется это свойство важнейшим, поскольку 
именно оно позволяет нейрону отыскивать коррелирующие события в среде. 
А только отыскав корреляции событий в среде, и можно строить целесообраз- 
ное управление. 

Представим более подробное и формализованное описание этой модели 
нейрона. 
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В этой модели нейрона реализовано уже упоминавшееся выше свойство 
синапсов увеличиваться в размерах при их активном использовании, и главное 
свойство — взаимное стимулирование роста синапсов при их одновременной ра- 
боте. При увеличении площади синаптического контакта связывается большее 
число каналов на мембране сомы, и в этом явлении можно усмотреть процесс 
накопления нейроном статистики по входным сигналам. Явление взаимного 
стимулирования роста одновременно работающих синапсов связано с выделе- 
нием возбужденным синапсом медиатора, концентрация которого уменьша- 
ется при удалении от места расположения синапса на мембране сомы. Если в 
зоне повышенной концентрации медиатора оказывается другой возбужденный 
синапс, то рост последнего происходит ускоренно. Это явление фактически 
обеспечивает нейрону возможность выделять коррелированно работающие 
синапсы, т.е. неслучайные входные векторы или неслучайные фрагменты 
входных векторов. В некоторый момент увеличивающиеся синапсы достигают 
таких размеров, что поступление на вход нейрона соответствующего им неслу- 
чайного вектора, способно вызвать деполяризацию нейрона, достаточную для 
возбуждения спайка. 

Модель, названная нейроном типа, Ш, моделируя молекулярные процессы 
укрепления и деградации синаптических связей, способна выявлять коррели- 
рованно поступающие на вход нейрона сигналы, даже если таких сигналов 
всего несколько и гораздо меньше, чем число входов нейрона. Будем связывать 
с размером синапса некоторый вес ш;, приписанный 1-му входу нейрона, 
подобно тому, как это имеет место в традиционных искусственных нейронных 
сетях. Однако изменение каждого веса будет производиться самим нейроном. 

Пусть выходной сигнал нейрона определяется соотношением 


т, 
ое 1, если у ди > 0, 
— 1=1 


ш 


(6) 


0 в остальных случаях, 


где х; есть 1-я компонента входного вектора, х; Е {0,1}, а 9 есть порог, 
0<0<1. 

В начальный момент времени $ = 0 все веса имеют одинаковые и небольшие 
значения, при которых О, = 0, например, 


ео 


с 
—, где 0 <0 <. 
т, 
При поступлении первых входных векторов начинается процесс обуче- 
ния нейрона, связанный с изменением весов. Новое значение веса есть 
ой 1+1 
ш = шў + аш; , где приращение 
рр сі 
аш; — Л 1 (0 4 ) 
функционально зависит от предыдущего значения вектора весов 10 и посту- 
пившего входного вектора 2". 
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Предлагается следующий вид функции };: 


т, 


т, 
Не ү — 2.6 Е ЕЕ 2,2 2—р: тоа (1—7) 
Е.) = аж: [1- у ш | + аи; (23 – 1) у туше А 
ј=1 ј=1 


(7) 
У: = 1, т, 


где р есть параметр четкости, р 2 0, а 


Вай. при р> 0 
201. 9=%/9) ? 
а = 1 
— при р= 0. 
т 
При этом отметим, что 
22 – 1 1 


ша Пи ох = —. 
р0 2(1— 27"Р/2) т 
Чтобы обеспечить независимость веса от его абсолютного номера, примем 
шо4 (# – Ј) = шіп(|? – Л; т- [2 3). 


Таким образом, характер обучения нейрона зависит от стартового пара- 
метра с и в меньшей степени — от параметра четкости р. 

Формула приращения включает два слагаемых, одно из которых равно 
нулю при 2 = 0, а второе равно нулю при 2 = 1. Отсюда видно, что при 2" = 0 
приращение веса отрицательно, иначе — положительно, другими словами, 
чем активнее данная компонента, (синаптическая связь), тем сильнее растет 
вес, и, наоборот, веса пассивных связей деградируют. При этом синхронно 
работающие активные связи взаимно укрепляют друг друга. Если связь не ак- 
тивна, деградация ее тем больше, чем больше в данный момент активных 
соседей. В формуле (7) такая кооперативность отражена в правом множителе. 
Поясним роль множителя 4 во втором слагаемом. Он определяется из условия 
невосприимчивости шумовой компоненты сигнала в период формирования 
образа. Пусть на вход нейрона подаются векторы, где каждая компонента 
в любой момент времени равна 1 с некоторой одинаковой для всех компонент 
вероятностью, т.е. имеем случайный сигнал. В этом случае отсутствуют неслу- 
чайные прообразы, а значит, и не должно происходить заметного изменения 
весов. Множитель 4 должен быть таким, чтобы уравновесить положительное 
и отрицательное приращения. 

После того как будет получен первый единичный выходной сигнал О!, = 1, 
полагаем нейрон обученным, а образ О, — сформированным. После этого 
события начинается второй этап обучения, во время которого возможно рас- 
познавание сформированного образа. В биологии известно, что деградация 
синаптических связей имеет место только в начальный период развития, 
с возрастом это явление постепенно исчезает. Поэтому для второго периода, 
обучения приращение веса, будем рассчитывать по формуле 


т, т. 
аш! = тілі 1 — у и" у бий е-Р' "04 (1-0), ү; = Тт. (8) 
7=1 2=1 
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Здесь отсутствует слагаемое, ответственное за деградацию. При этом усилива- 
ются веса, соответствующие образующим прообраза, в то время как остальные 
веса достаточно малы и их изменения незначительны. Чем активнее образую- 
щая, тем активнее растет вес. В соответствии с выражением (6), это позволяет 
распознавать образ по неполному числу характерных признаков. 

Рассмотрим роль стартового параметра с. Качество обучения тем выше, 
чем меньше веса случайных компонент. Для одной и той же обучающей 
выборки, содержащей некоторый прообраз, веса, имевшие большие начальные 
значения, после того как образ сформирован, различаются меньше, чем веса 
с меньшими начальными значениями. Другими словами, веса, соответствую- 
щие образующим, в целом растут, а остальные веса уменьшаются. Естественно, 
при меньших начальных значениях конечные веса отличаются сильнее. Эта 
разница зависит и от выраженности прообраза. Выраженность прообраза, 
на фоне шума или по сравнению с другими прообразами может быть разной. 
Интуитивно понятно, что эта характеристика монотонно растет с увеличением 
частоты предъявления и числа образующих. Поэтому чем более выражен 
прообраз, тем большее значение с можно взять без риска, что сумма в (6) будет 
меньше порога 0. Для наглядности приведем график (рис. 3.28) зависимости 
весов от времени в случае единичных сигналов, где т = 10, ас = 0,1. В этом 
случае все веса в любой момент времени равны. 

График имеет следующие свойства. 


1. Чем меньше мы выбираем стартовый параметр, тем дольше продолжа- 
ется процесс обучения, но тем выше качество обучения. Поэтому с целесооб- 
разно оптимизировать. 


2. Имеет место независимость максимальной скорости роста весов от числа 
входов т, от о и р. Значение веса при максимальной скорости роста все- 
гда равно 2/3 от максимального значения для случая единичных векторов. 
Обычно к этому моменту распределение весов уже сформировалось. Из этих 
соображений порог 9 выбирается равным 2/3. В экспериментах мы использо- 
вали о порядка 0,01 и обычно первый период занимал около 98% всего времени 
обучения. 


10 20 30 40 50 60 70 80 90 100 110 
Время 


Рис. 3.28. Зависимость весов от времени в случае единичных сигналов, 
где т = 10, в = 0,1 
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Рис. 3.29. Нейрон типа Ш, который научился распознавать прообраз, представлен- 
ный во входном векторе пятью коррелирующими компонентами: 
4-й, 7-й, 9-й, 12-й и 14-й 


Сумма весов при обучении постоянно растет, выходя на насыщение, и ни- 
когда не может быть больше единицы (см. рис. 3.28). Это ограничение соот- 
ветствует ограничению суммарной площади синапсов в физической модели. 

Рассмотрим параметр четкости р. Целесообразность его учета объясня- 
ется физической моделью — экспоненциальным уменьшением концентрации 
химического фактора (медиатора) с расстоянием. Формально он определяет 
степень связности соседних входов. При р = 0 взаимодействие весов вообще 
не зависит от их взаимного расположения. При низких р соседние веса, будут 
мало отличаться друг от друга, а значения весов с соседними номерами после 
обучения на одной и той же обучающей выборке будут тем более близкими, 
чем меньше р. Если характер выборки заранее не известен, разумнее всего 
установить р = 0, так как тогда не учитывается взаимное расположение вхо- 
дов, а время вычислений сократится за счет исчезновения экспоненциального 
множителя. 

Работу нейрона типа Ш проиллюстрируем следующим примером 
(рис. 3.29). На входы нейрона подавалась смесь случайных сигналов и 
неслучайного вектора (прообраза) с единичными компонентами с номерами 4, 
7, 9, 12 и 14. В результате самообучения нейрона выше порога поднялись веса, 
именно этих входов, т. е. нейрон обучился распознавать данный образ. 


3.2.7. Свойства сетей, 
составленных из нейронов типа Ш 


Рассмотрим простую ситуацию, когда входной вектор с известной размерно- 
стью т содержит прообраз, имеющий К образующих, К < т. Для данной 
обучающей выборки нужно построить и обучить сеть. Решение этой задачи 
возможно с помощью одного нейрона типа Ш, а при использовании нейронов 
типа І потребуется нейросеть, число нейронов в которой равно всем возмож- 
ным сочетаниям из т по К. 
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Основным достоинством нейрона типа Ш является его способность нахо- 
дить неслучайные прообразы среди множества поступающих на него различ- 
ных по составу векторов. Это позволяет сократить число нейронов в ней- 
росетях управляющих систем ААУ по сравнению с нейронами типа І и П. 
Например, вместо трехмерной матрицы из нейронов типа І, необходимых для 
построения Базы Знаний (которые будут рассмотрены ниже), можно исполь- 
зовать двумерную матрицу из нейронов типа, Ш. 

Недостатки нейрона типа Ш состоят в следующем. 


1. Такой нейрон имеет большую вычислительную сложность по сравнению 
с нейронами [ и П. Недостаток может быть обойден увеличением вычислитель- 
ной мощность процессора, реализующего алгоритм нейрона, либо сокраще- 
нием или оптимизацией алгоритма работы нейрона в соответствии с реалиями 
конкретного приложения. 


2. Нейрон типа Ш выявляет только один прообраз из всех, которые 
на него отображаются в пространстве признаков. Остальные прообразы игно- 
рируются. В случае использования сети нейронов типа І или П могут быть 
выявлены все прообразы, если они действительно неслучайны. Недостаток 
можно обойти, если «наводить» нейрон только на ту область в пространстве 
признаков, про которую априори известно, что в ней находится только один 
образ. Либо применять нейрон в тех ситуациях, когда нужно выявить наи- 
более активный прообраз среди всех других прообразов, даже если они тоже 
не случайны. 


Достоинства нейрона типа, Ш состоят в следующем. 


1. Один нейрон способен проверить множество гипотез о существовании 
образов, что может позволить сократить объем нейросети в управляющей 
системе. 


2. Нейрон хорошо отражает некоторые важные свойства, биологического 
нейрона. 


3.2.8. Модель нейрона типа ГУ 


Наконец, предложим наиболее универсальную из рассмотренных здесь схему 
нейрона. Она получается из нейрона типа П, если заменить в нем элемент Ви, 
на блок, функционально аналогичный нейрону типа Ш. При этом на входы 
этого блока следует подавать сигналы с элементов, регистрирующих различ- 
ные варианты временных задержек А; и т;. В этом случае нейрон типа ТУ 
сможет находить неслучайный вариант пространственно-временного прооб- 
раза в потоке поступающих на него входных векторов. 


3.2.9. Синапсы как элементы сети 


Следует также несколько подробнее коснуться синапсов, которые, являясь со- 
ставной частью нейронов, играют весьма важную роль в нервной системе. Роль 
их двояка. С одной стороны, по-видимому, именно синапсы вносят решающий 
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Рис. 3.30. Модели синапсов-коннекторов и синапса-инвертора 


вклад в поиск корреляций между входными сигналами, как это обсужда- 
лось выше при рассмотрении моделей нейронов. Работа синапса определяется 
не только процессами, происходящими непосредственно в синапсе и в соме 
нервной клетки, но и диффузионными механизмами, обеспечивающими обмен 
информацией через межклеточную среду, в частности, посредством различных 
медиаторов, избирательно активизирующих работу синапсов. 

С другой стороны, синапсы обеспечивают соединение нейронов друг с дру- 
гом. Из биологии известно, что в зависимости от того, что с чем соединяет си- 
напс, различают аксо-дендритные, аксо-соматические, аксо-аксонные, дендро- 
соматические, дендро-дендритные, сомато-соматические синапсы. Кроме того, 
напомним о существовании тормозящих синапсов. При построении нейросетей 
соединительную функцию синапсов-коннекторов мы моделируем такими эле- 
ментами, как «синапсы-соединители» и «синапсы-разветвители» (рис. 3.30), 
а роль тормозящего синапса играет тормозящий вход нейрона типа І. При 
необходимости получения инверсного сигнала можно использовать и «синапс- 
инвертор», что тоже можно рассматривать как тормозящий синапс. Функция 
синапса-разветвителя очевидна, функцию синапса-соединителя можно смо- 
делировать логическим элементом «ИЛИ», функцию синапса-инвертора — 
логическим элементом «НЕ». 

Надо сказать, что функции биологических синапсов как соединителей, 
по-видимому, очень многообразны. В свое время Г. Д. Крейн (по кн. [26]) 
указывал, что различные способы соединений нервных волокон, имеющих 
активный тип проводимости, сами по себе могут составить логический базис 
из элементов «И», «ИЛИ» и «НЕ». Напомним, что в нервном волокне с актив- 
ным типом проводимости, каковым является аксон, амплитуда движущегося 
нервного импульса не затухает за счет источников энергии самого волокна. 
В волокне с пассивным типом проводимости, каковым является дендрит 
и сама мембрана сомы, амплитуда импульса затухает при распространении. 
Г. Д. Крейн показал, что, имея модель нервного волокна с активным типом 
проводимости, которую он называл нейристором, можно с помощью различ- 
ных способов соединения таких волокон образовать весь логический базис «И», 
«ИЛИ», «НЕ», построить триггер и, следовательно, вычислительную машину. 


3.2.10. «Элементный базис» нейроноподобной системы 
автономного адаптивного управления 


Рассмотренные выше модели нейронов типов [-ТУ вместе с моделями синапса- 
коннектора и синапса-инвертора составляют полный логический элементный 
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базис для построения разнообразных логических схем. Логические элементы 
«И», «ИЛИ» и «НЕ» могут быть реализованы с помощью элементов этого 
базиса различными способами: из синапсов или нейронов типа І, при соответ- 
ствующей установке значений порога, р и порога М. 

Так, если р = 1/т, где т — число входов нейрона, М = 1и 0 = 1, то нейрон 
типа [ будет работать просто как элемент «ИЛИ», если снимать выходной 
сигнал с выхода 2, либо как элемент «ИЛИ» с триггером (при желании триггер 
можно убрать), если снимать выходной сигнал с выхода О. Если установить 
порог р больше 1/т, то это заставит нейрон работать как пороговый элемент 
«ИЛИ». Если порог р = 1, получим элемент «И». 

Однако основное назначение нейронов шире: нейроны играют роль уже 
целых вычислительных блоков — небольших самообучаемых систем распозна- 
вания. 


3.2.11. Возможности синтеза нейроноподобной подсистемы 
формирования и распознавания образов 


Вначале рассмотрим основные свойства сетей из предложенных моделей ней- 
ронов, покажем, что могут делать такие сети, а затем покажем, как можно их 
конструировать. 

Рассмотрим сети из нейронов типа І как наиболее нами изученные к насто- 
ящему времени. 


Формирование и распознавание образов К-го порядка. Возьмем неко- 
торую произвольную сеть из нейронов типа І с У входами, фрагмент примера 
такой сети показан на рис. 3.31. Пусть «Блок датчиков», который поставляет 
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Рис. 3.31. Фрагмент сети формирования и распознавания образов (ФРО), состав- 
ленной из нейронов типа І 
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сигналы нашей сети, моделируется следующим генератором бинарных векто- 
ров. Выберем несколько векторов из К = 2" векторов, возможных при У 
входах, которые будут обозначать у нас прообразы некоторых гипотетиче- 
ских объектов в среде. Пусть вероятность предъявления «Блоком датчиков» 
векторов-прообразов будет заметно выше, чем 1/ К. Остальные векторы пусть 
предъявляются с равной вероятностью. 

Будем наблюдать за поведением сети при подаче на нее векторов Блоком 
датчиков. Если среди нейронов 1-го уровня найдутся такие, что на них будут 
отображаться векторы-прообразы или их фрагменты, то эти нейроны нач- 
нут обучаться и будут делать это быстрее, чем другие нейроны. Пороги М 
в нейронах можно установить так, что нейроны 1-го уровня, соответствующие 
прообразам или их фрагментам, обучатся, образовав образы 1-го порядка. Обу- 
ченные нейроны 1-го уровня теперь будут распознавать образы при появлении 
их прообразов на входных полюсах сети. После того как будут сформированы 
и начнут распознаваться образы 1-го порядка, создается возможность для 
формирования образов 2-го порядка нейронами 2-го порядка. Напомним, что 
нейрон является нейроном К-го порядка, если максимально длинный путь от 
его входа к датчикам (входным полюсам сети) состоит из К последовательных 
связей. Например, на рис. 3.31 нейрон 11 является нейроном 4-го порядка, так 
как наиболее длинный путь от него к датчикам есть путь ту — п — 75 — 
пә — 42. Сигналы от распознанных образов порядков < К вместе с сигналами 
от датчиков, если они одновременно поступают на нейрон К-го порядка п 
и это повторяется М раз, приводят к формированию образа К-го порядка О. 
Отключение сигнала О, = 1 от распознанного образа может производиться 
следующими способами: 


а) сигналом на «тормозящий» вход Й„, от нейрона большего порядка, если 
тот распознал образ, в который О, входил как одна из образующих; 

б) сигналом на «тормозящий» вход от нейрона за пределами подсистемы 
ФРО, получившего и использовавшего этот сигнал; 

в) триггерным элементом Т в нейроне типа І, если через время т триггер 
сбрасывается в 0, подобно тому, как это сделано в нейроне типа П; 

г) возвратной коллатералью нейрона. 


Например, пусть (рис. 3.31) вектор Х = (1,1,1,0,*,*,...) отражает неко- 
торый прообраз, который относительно часто появляется среди сигналов, 
передаваемых датчиками 41, 42, з, 44,..., на вход подсистемы ФРО. Посте- 
пенно будут обучены нейроны 2-го порядка пу и т, а затем и нейроны 
3-го порядка пз и по. Пусть выходными сигналами подсистемы ФРО явля- 
ются выходные сигналы нейронов т5у-п1з, которые соответствуют образам О;. 
Можно не задумываться о том, от какого именно нейрона пришел выходной 
сигнал на выход подсистемы ФРО, и нумеровать образы просто в порядке 
их формирования, т. е. по порядку первого их распознавания — появления 
сигнала «1» на этом выходе. Однако как только образ сформирован и начинает 
учитываться в работе системы, надо четко отождествлять его с тем выходом 
подсистемы ФРО, на котором он появляется. В данном примере для удобства 
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обозначим выходы подсистемы ФРО и образы теми же номерами и, которыми 
обозначены нейроны п, в сети. 

Итак, через некоторое время можно будет наблюдать, что подсистемой 
ФРО при подаче на ее вход вектора Х = (1,1,1,0,*,*,...) распознаются 
образы Оз, Об, Оз и Од, что проявляется в виде сигналов «1» на выходах 
5, 6, Зи 9 соответственно. 

Если мы используем только возможность отключения образа с помощью 
сигнала на «тормозящие» входы от нейронов большего порядка при распозна- 
вании ими образов (случай (а)), то увидим, что образы Оз и Оз после того, как 
они были распознаны в первый раз, остаются распознанными, как бы сохраняя 
в оперативной памяти информацию о факте их распознавания, которая пока 
не востребуется системой. Однако образы О и Об через некоторое время после 
их распознавания отключаются, потому что информация о факте их распозна- 
вания «перешла» в распознанные образы Оз и Од и сохраняется ими. Нейроны 
пу и п, распознавшие образы Оу и Об, тем самым высвобождаются из данного 
акта распознавания и становятся готовыми к дальнейшей работе в системе. Со- 
держательным примером, соответствующим рассмотренному примеру работы 
сети уже в стадии, когда нейроны обучены и распознают образы, может быть 
следующая ситуация. Мы читаем текст, прочитали и распознали несколько 
букв (распознаны образы букв ОБ и Об). По этим буквам распознался образ 
определенных слов (Оз и Оз). Как только слова были распознаны, оперативная 
память перестала хранить информацию о распознанных буквах ОБ и Об, осво- 
бодив нейроны для их дальнейшей работы, а вся информация теперь хранится 
в распознанных образах слов Оз и Оз. Если бы нейроны, распознавшие буквы, 
не были отключены, мы не смогли бы двигаться дальше по тексту, так как 
вынуждены были бы все время помнить об этих последних буквах, и это 
занимало бы нали мозг, не давая ему продолжать чтение. Однако такая ситуа- 
ция с невостребованностью распознанных образов произошла, в этом примере 
с образами слов Оз и Оо. Нервная система распознала эти слова, добросовестно 
поддерживает информацию об этом в оперативной памяти, но эти образы 
не инкорпорируются в образы более высокого порядка (фразы) и потому 
«зависли» в памяти, как слова фразы, которую мы не успели дослушать 
и понять ее смысл. Весьма жизненная ситуация. 

На этом элементарном примере можно увидеть и еще одно реалистическое 
свойство рассмотренной нейросети. Пусть после того как система распознала 
некоторые образы разных порядков, мы будем продолжать демонстрировать 
датчикам этот же прообраз, т. е. будем поддерживать на входе системы посто- 
янное воздействие. Например, будем показывать нашей системе один и тот же 
прообраз — вектор Х = (1,1,1,0, є, *,...). Мы увидим, что в нейросети устано- 
вится колебательный режим. Образы Оз и Оу будут оставаться распознанными 
постоянно, однако образы Оу и Об будут от такта к такту то распознаваться, 
то вытесняться. С точки зрения цифровых потактовых схем это явление 
обычное и понятное. Однако биологи часто наблюдают такие колебательные 
состояния нервной системы при постоянных внешних на нее воздействиях. 
Например, известно, что у человека в состоянии умственного и физического 
покоя, с закрытыми глазами, в электроэнцефалограммах хорошо проявляется 
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альфа-ритм с частотой 8-13 Гц [18], природу которого биологи не объясняют. 
Нам представляется это совпадение свойств с моделью не случайным. 
Заметим, кстати, что в данном эксперименте отражается зависимость 
результата обучения системы от предыстории. В некоторых случаях этого 
эксперимента после обучения нейронов участвующий в колебательном режиме 
вектор (О, Ов, Оз, Оо) принимал с периодом в 2 такта значения (0,0,1,1), 
(1,1,1,1), ав некоторых экспериментах — значения (1,0, 1, 1), (0,1,1,1). В этом 
нет ничего удивительного, поскольку для обучения использовался рандоми- 
зированный процесс подачи входных векторов, и поэтому могло обучиться 
несколько различное множество нейронов, либо они обучились в несколько 
иной очередности. Это тоже отражает свойства реальных нервных систем, 
поскольку хорошо известно, что невозможно провести обучение биологической 
системы абсолютно детерминированно, даже при детерминированной подаче 
дидактического материала, — слишком велико влияние многих случайных 
факторов, в том числе предыстории системы, ее ранее накопленного опыта. 


Ассоциативное распознавание образов. Возможность рассмотренной 
нейросетевой схемы формировать образы разных порядков, агрегирующих 
в себе другие образы и показания все более широкого круга датчиков, приво- 
дит к явлению, которое обычно принято называть ассоциативной памятью. 
Например, ребенок, увидевший солнце, распознает, возможно, только яркое 
пятно, если у него к этому моменту сформировались лишь образы, объеди- 
няющие выходы зрительных рецепторов. У взрослого человека в результате 
многочисленных повторений в процессе обучения и повседневной практики од- 
новременного наблюдения зрительных, слуховых и других образов, связанных 
с солнцем, должны быть сформированы образы, ассоциирующие различные 
другие образы, основанные в том числе на показаниях других датчиков. По- 
этому взрослый человек в этой же ситуации вспомнит и слово «солнце», и ан- 
глийское слово «Ѕип», и, если он астрофизик, вспомнит и то, что температура 
на его поверхности 5000 К, и, возможно, вспомнит известное стихотворение 
о солнце Маяковского и множество других образов, связанных с солнцем. Это 
все разные образы, они получены разными нейронами. Таких нейронов много, 
и если даже со временем часть этих нейронов отомрет, и человек поэтому 
что-то забудет — как называется солнце по-английски или сколько до него 
километров, все равно, множество образов, связанных с солнцем, будет им 
распознаваться. 


Пространственно-временные образы. Рассмотрим временную диаграмму 
(рис. 3.32), в которой на оси абсцисс отложены пронумерованные такты вре- 
мени, а на оси ординат указаны номера датчиков и нейронов (номера образов 
пусть равны номерам нейронов). Если в некоторый момент времени выходной 
сигнал нейрона равен «1», будем это показывать зачерненным прямоугольни- 
ком. 

Пусть в подсистеме ФРО, показанной на рис. 3.31, нейрон ті на такте 
+ = 24 распознал образ Оли, т. е. имеем 023 = 0 и О?1 = 1. Это означает, что 
на такте # —1 (2 = 23) на выходах нейронов пз, т и пл были сигналы «1». 
В свою очередь, из этого следовало, что на такте # — 2 (Ё = 22) на выходах 
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Рис. 3.32. Пространственно-временной прообраз распознанного образа в виде единичных сигналов на выходах датчиков 
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нейронов 71, по, тз, П5 и на датчике 44 должны были быть сигналы «1». 
Отсюда следует, что на такте #—3 (# = 21) сигналы «1» имели место на выходах 
нейронов 71, пә и на датчиках 41, 42, аз. Наконец, на такте # – 4 (1 = 20) 
сигналы «1» должны были быть на датчиках 41 и 42. Из сказанного следует, 
что прообразом образа Оі, распознанного нейроном ті на такте & (+ = 24), 
была определенная пространственно-временная последовательность сигналов 
на выходах датчиков (на рис. 3.32 эта комбинация сигналов обведена рамками 
в строках «датчики»). А именно, на такте $ — 4 ( = 20): 41 = Ти 42 = 1, 
на такте $ — 3 (# = 21): 41 =1, 42 =Ти аз = 1, на такте {— 2 (Е = 22): 44 = 1. 

Очевидно, что это есть только обязательные компоненты прообраза, ко- 
торые следуют из того, что на такте і был распознан образ О. Однако мы 
не учитывали требований, которые налагались другими распознанными или 
не распознанными на такте # образами. Кроме того, следует учитывать, что 
нейроны типа І работают подобно тоническим датчикам, реагируя на наличие 
сигнала, поэтому при использовании сети из таких нейронов остается некото- 
рая неопределенность относительно моментов появления сигналов. Тем не ме- 
нее, нейроны типа І, благодаря наличию задержки срабатывания в один такт 
времени, позволяют формировать и распознавать образы пространственно- 
временных процессов. Это принципиально важное свойство распознающей 
системы. 

Фрагмент процесса на более поздних тактах, например $ = 20, 21, 22, 23, 24, 
показывает акт распознавания ранее (на тактах # = 1-13) сформирован- 
ного образа О пространственно-временного прообраза (обведенного рамкой 
в строках «датчики»). Собственно процесс формирования образа Оу показан 
на этом же рисунке на тактах ф с 1-го по 13-й. Здесь запротоколирована 
работа необученной сети (рис. 3.31), для всех нейронов которой установлены 
параметры ршах = 1, рм = 0,9, рь = 0,7, М = 2, © = 2. На датчики 
сети 41—44 четыре раза подряд подавалась определенная комбинация сигналов, 
длиной в 3 такта (обведена рамками) — прообраз. В результате обучения 
к такту & = 13 нейрон ту обучился, а на такте $ = 14 нейрон ті уже 
распознал образ этого прообраза. После такта { = 14 нейрон љу продолжает 
некоторое время удерживать выходной сигнал, как триггер, до тех пор, пока 
он не будет отключен каким-либо нейроном более высокого порядка (либо он 
не отключится по истечении фиксированного времени, если такая возможность 
в нейроне предусмотрена). 

Итак, этот пример иллюстрирует способность сети из нейронов типа І 
формировать образы процессов, представленных некоторым «фильмом» из 
сигналов на ее входе. Примерами образов пространственно-временных явлений 
могут быть образы периодических сигналов, образы причинно-следственных 
событий. 


Частотное кодирование информации. Как было сказано выше, выходные 
сигналы рецепторов и нейронов на самом деле представляют собой серии 
периодических импульсов. Такой «синтаксис» выходного сигнала позволяет, 
не отступая от принципа «все или ничего», нести дополнительные сведения 
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Рис. 3.33. Нейрон может распознавать конкретное изменение частоты сигнала 


о распознаваемом прообразе. В частности, как отмечалось, информацию мо- 
жет нести изменение частоты выходных нервных импульсов. 

Покажем, что нейроны могут реагировать на конкретные изменения ча- 
стоты сигнала (рис. 3.33). Пусть сигналы от периодического источника по 
очереди подаются на входы нейрона. За время #1 импульс пройдет расстояние 
1, в этот момент второй импульс начинает свое движение по второму каналу, 
и за время їз оба импульса проходят расстояние 42. После этого третий им- 
пульс подается на третий вход. Импульсы одновременно достигнут аксонного 
холмика только в том случае, если скважность сигналов имеет определенное 
значение, например изменяется от #1 к 0. 

Подобная схема строится из нейрона типа П с тремя входами, имеющими 
разные задержки А}, Аз и Аз. Нейрон будет реагировать только на изменение 
частоты подаваемых на него импульсов от 1/1 к 1/2. 

Совокупность таких специальных нейронов, реагирующих на разные изме- 
нения частот, представляют собой «повышающие» и «понижающие» датчики, 
описанные выше. Они преобразовывают частотно-модулированный сигнал 
в двоичный пространственно-временной. 


Распознавание образов в условиях помех. Покажем на тех же примерах 
сети и прообраза (рис. 3.31 и 3.32), что сеть ФРО из нейронов типа І может 
распознавать образы в условиях помех. Пусть сеть научилась распознавать 
образ О11. Это отражено на рис. 3.34, где на такте $ = 6 срабатывает нейрон 
ті после демонстрации на датчиках пространственно-временного прообраза. 

В этом примере нейрон ті имел следующие параметры: ршах = 1, 
рм = 0.67, рш = 0.51, и пусть через некоторое время эволюции порог р(№) 
у нейрона п11 опустился уже ниже 0.66. Пусть в момент Ё = 20 снова началась 
демонстрация прообраза на, датчиках. Однако по каким-либо причинам часть 
прообраза, которая должна была зафиксироваться датчиком 44 в момент 
Е = 22, не была зарегистрирована, например, из-за помехи или неисправности 
датчика. Однако, как можно видеть из протокола работы сети, нейрон ті 
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Рис. 3.34. Сеть ФРО способна распознавать образ при наличии помех. Слева — 
распознавание образа О11 без помехи, справа — с помехой 


сработал на такте і = 24, и образ Оу был успешно распознан, несмотря 
на помеху. 


Предсказание будущих событий. Рассмотрим пример на рис. 3.35. Пусть 
на датчиках 41-44 сети несколько раз демонстрируется прообраз длиной в 6 
тактов, везде на рисунке этот прообраз обведен серыми рамками. Пусть 
нейрон п11(нейросеть та же, что и на рис. 3.31) обучился распознавать этот 
прообраз в виде образа О}. На рис. 3.35 (а) показан процесс формирования 
образа О11. Рисунок 3.35 (6) демонстрирует, как обученный нейрон туі рас- 
познает образ О. Заметим, что момент распознавания образа происходит 
через 7 тактов после начала, демонстрации прообраза. Пусть через некоторое 
время (рис. 3.35 (в)) порог у нейрона п11 опустился ниже 0.67. Теперь, как 
можно видеть на рис. 3.35 (в), нейрон п11 начинает распознавать образ О11 не 
через 5, а уже через 4 такта после начала его демонстрации. Другими словами, 
нейрон научился распознавать образ раньше, чем закончилась демонстрация 
прообраза. Например, если данный прообраз соответствует распознаваемым 
частям входящей в комнату кошки, для распознавания которой нужно распо- 
знать все ее части, то со временем мы начинаем распознавать кошку раньше, 
чем распознаем ее хвост. Это есть предсказание еще не наступивших событий! 
Очевидно, что данное свойство нейрона и сети является крайне важным при 
управлении. 
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Рис. 3.35. Обучившийся нейрон, после достаточного снижения порога, может распо- 
знавать пространственно-временной образ раньше, чем закончится его восприятие, 
т. е. нейрон способен к предсказанию будущих событий 


В качестве содержательной интерпретации способности нейронов к пред- 
сказанию событий можно привести также ситуацию с собакой Павлова. Пусть 
сигналы 41 = Ти 42 = 1 отражают наблюдение собакой появления света, 
в комнате, сигнал 43 = 1 отражает услышанный собакой звук открывающейся 
двери, а сигнал 44 = 1 пусть соответствует распознаванию собакой еды. 
Сформированный собакой образ О есть образ всей этой прелюдии к процессу 
кормления. Распознавание этого образа пусть запускает у собаки процесс 
слюноотделения. И вот после того как порог у нейрона п11 упадет ниже 0.67, 
образ О11 начнет распознаваться собакой (с соответствующим слюноотделе- 
нием) сразу после того, как зажжется свет и откроется дверь, т.е. раньше, 


чем на сцене появится собственно еда. Тем самым, свойство нейронов типа І 
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Рис. 3.36. Способность нейрона распознавать образ по неполному прообразу можно 
использовать для распознавания еще не реализовавшейся части прообраза, т. е. для 
предсказания соответствующих будущих событий 


предсказывать еще не наступившие события может объяснять и моделировать 
механизм условного рефлекса. 

Графически способность нейрона предсказывать будущие события можно 
представить так (рис. 3.36). Пусть нейрон ранее сформировал образ некото- 
рого пространственно-временного явления и зафиксировал его в своей памяти. 
Пусть нейрон в прошлом уже распознавал этот образ, и порог в нейроне сни- 
зился. Пусть в некоторый момент времени данное закономерное явление снова 
начинает воспроизводиться, и нейрон начинает наблюдать появляющийся про- 
образ этого явления. Если из-за, сниженного порога нейрон распознал данный 
образ раньше, чем закончилась демонстрация прообраза, то тем самым нейрон 
«знает», предсказывает ту часть происходящего явления, которая еще не ре- 
ализовалась в действительности. Управляющая система, получив сигнал от 
этого нейрона, может еще успеть отреагировать на предсказанную часть дан- 
ного закономерного явления (например, уйти от надвигающейся опасности). 

Здесь можно обобщить понимание функции нейрона. Можно видеть, что 
нейрон выполняет задачи, присущие любой системе анализа данных. Счита- 
ется [1], что при анализе данных решаются две основные задачи: задача поиска 
закономерностей в имеющихся данных и задача прогнозирования недостаю- 
щих данных по имеющимся данным. Мы полагаем, что при анализе данных 
решаются не две, а три основные задачи, именно: 


а) выявление закономерностей в имеющихся данных, с запоминанием мно- 
жества выявленных закономерностей в памяти; 

б) распознавание тех закономерностей из имеющихся в памяти, которые 
действуют в конкретном месте структуры данных (например, в текущий 
момент времени); 
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в) прогнозирование неизвестных данных на основании имеющихся данных 
и распознанной закономерности (например, прогнозирование будущих 
значений временного ряда на основании той из известных закономерно- 
стей, которая, как показывает решение задачи распознавания, действует 
в текущий момент времени). 


Нейрон действительно является своеобразной системой анализа данных: он 


а) выявляет закономерности в предыстории наблюдаемых им входных дан- 
ных и фиксирует найденную закономерность (образ) в своей памяти, 

б) способен неоднократно распознавать эту закономерность во входных 
данных, если она там появляется, 

в) способен предсказывать недостающие данные во входном векторе 
в случае зашумления прообраза пространственного образа или 
прогнозировать будущие данные в случае демонстрации прообраза 
пространственно-временного образа. 


Именно эти свойства и позволяют нервной системе осуществлять адаптивное 
управление, как это будет показано ниже, при рассмотрении таких подсистем, 
как База Знаний и механизмов принятия решений. 

А сейчас продолжим рассмотрение возможностей предлагаемой модели 
нейрона как системы распознавания. 


Измерение текущего значения величины с помощью датчиков при- 
ращения. Покажем, как можно распознавать образы текущего абсолютного 
значения регистируемой величины, используя только фазические датчики, т.е. 
датчики, реагирующие только на приращение величины. Ценность этой схемы 
состоит в том, что данную задачу распознавания удается решить с помощью 
меньшего числа датчиков, если использовать именно фазические, а не тони- 
ческие датчики. 

Нам потребуется два вида датчиков, одни из которых должны регистриро- 
вать «повышение», а другие — «понижение» наблюдаемой величины. Каждый 
вид датчиков можно разделить на подвиды: одни реагируют на малые изме- 
нения, другие — на большие. При этом пусть датчики больших изменений, 
в случае срабатывания, отключают датчики малых изменений. 

Воспользуемся нейронами типа П. Аппарат ФРО организуем из «индика- 
торных», «повышающих» и «понижающих» нейронов. Индикаторные нейроны 
указывают на величину измеряемого параметра. Повышающие и понижающие 
нейроны служат для переноса активности от одного индикаторного нейрона 
к другому. Схема соединения индикаторных и повышающих /понижающих 
нейронов приведена на рис. 3.37. Схема повышающего /понижающего нейрона 
приведена на рис. 3.38. При активизации индикаторного нейрона на следую- 
щем такте он посыляет сигнал на все связанные с ним повышающие и по- 
нижающие нейроны. После этого все повышающие и понижающие нейроны 
находятся в состоянии ожидания сигнала, от соответствующего датчика. Как 
только сигнал от датчика достигнет повышающего или понижающего нейрона, 
то нейрон активизируется и на следующем такте пошлет сигнал на соответ- 
ствующий индикаторный нейрон, а также «отключающие» сигналы на все 
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Рис. 3.37. Схема соединения индикаторных и повышающих /понижающих нейронов. 
Отключающий сигнал при активации повышающего или понижающего нейрона идет 
на все нейроны, связанные с ним 


повышающие и понижающие нейроны, находящиеся в состоянии ожидания 
сигнала от датчиков. 

В результате работы такой схемы в управляющей системе, получающей 
на вход информацию только об изменении наблюдаемой величины с помощью 
небольшого числа датчиков, в каждый момент будет отображаться текущее 
значение наблюдаемой величины посредством аппарата, ФРО, в котором будет 
распознан образ текущего значения величины (рис. 3.39). 

Отметим, что принцип регистрации только изменений в наблюдаемых 
величинах часто используется в технических системах. Например, подобный 
подход используется в системе сжатия видеоинформации [19], в системах 
измерения угловых отклонений космических аппаратов и т. п. 
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Рис. 3.38. Схема повышающего/понижающего нейрона 


> 


Наблюдаемая температура 
Образы температуры 


> 
Такты времени 


Рис. 3.39. Образ текущего значения величины может распознаваться с помощью 
датчиков, регистрирующих только приращение величины, и специальной нейросете- 
вой конструкции 


В качестве другого примера продемонстрируем формирование образов 
пройденного пути у транспортного бионического робота (рис. 3.40). Известно, 
что у животного нет такого полезного датчика, как счетчика пройденного рас- 
стояния. Однако информация о пройденном расстоянии должна учитываться 
организмом при управлении. Можно сконструировать такой датчик из нейро- 
нов, которые будут распознавать образ пройденного расстояния. Здесь образы 
большего порядка соответствуют образам больших расстояний, при этом чем 
больше расстояние, тем меньше точность его отображения. На рис. 3.40 видно, 
что с увеличением времени и, соответственно, пройденного расстояния посте- 
пенно распознаются образы пройденного пути все больших порядков. 


Нейроноподобные программы. Как указывалось выше, отключающие об- 
ратные связи между нейронами могут быть использованы для построения 
своеобразных «программ», исполнителями которых являются специальные 
структуры из нейронов. Передавая сигналы друг другу через прямые и обрат- 
ные положительные и отрицательные связи, нейроны могут реализовывать 
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Рис. 3.40. Образы расстояния, с помощью которых животное (его модель — мо- 
бильный робот) может оценивать пройденное расстояние — биологический счетчик 
пройденного пути 


некоторые периодически повторяющиеся, циклические процессы. Такие про- 
цессы могут запускаться одним сигналом, например от некоторого нейрона, 
распознавшего ситуацию, при которой можно запускать такую «программу». 
Отключаться «программа» может тоже одним сигналом от некоторого ней- 
рона, который распознал условие необходимости прекращения выполнения 
«программы». 

Например, найденный природой оптимальный процесс ходьбы для орга- 
низмов определенного вида может быть зафиксирован уже в самой нейро- 
сети, в виде определенных конструкций из нейронов. Этот периодический 
процесс может запускаться одним сигналом и останавливаться тоже одним- 
единственным специальным «отключающим» сигналом, возникшим при рас- 
познавании необходимости прекращения ходьбы и поданным в конкретные 
места, нейросетевой конструкции. Элементарным примером такой конструкции 
может быть «программа» «генератор шагов» (рис. 3.41), которая реализуется 
конструкцией из четырех нейронов т -л4, запускается одним сигналом 41, 
который вызывает периодически повторяющуюся последовательность из двух 
сигналов Оз и Од с помощью двух нейронов тз и т4, по очереди возбуждающих 
и отключающих друг друга до тех пор, пока весь процесс не будет останов- 
лен одним сигналом 42. В схеме можно использовать также дополнительные 
нейроны в качестве элементов задержки на обратных связях. 

Данный способ использования рассмотренных нейронов нам представля- 
ется очень перспективным. «Программы», которые можно конструировать 
из нейронов с использованием их прямых и обратных связей, могут быть 
самыми разнообразными. Такие «программы» могут быть зафиксированы 
в самой структуре нейронной сети как живого организма, так и искусственных 
систем и определять их так называемое «репертуарное поведение», т. е. по- 
ведение, переданное по наследству от предков. При этом адаптивной может 
быть настройка только некоторых параметров таких «программ». Например, 
программа, ходьбы может быть зафиксированной в самой структуре нервной 
сети, но некоторые ее параметры (например, оптимальный темп, усилия мышц 
ит. п.) могут подбираться с помощью различных адаптивных механизмов, 
в том числе — описанных в этой книге. Хочется также подчеркнуть, что по- 
добные программы реализуются рассмотренными нейроноподобными схемами 
не просто как логическими переключательными схемами. Основное отличие 
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Рис. 3.41. Реализованная в нейросетевой конструкции (а) программа «генератор шагов», которая по очереди генерирует 
единичные сигналы Оз и Од, запускается сигналом 41 и отключается сигналом 42. Показаны процесс обучения сети (6) и работа 


самой «программы» от момента ее включения и до выключения. Попеременно возникающие сигналы Оз и Од можно использовать, 
например, для управления конечностями шагающего робота, 
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рассмотренных нейроноподобных сетей от логических схем состоит в том, 
что это самообучаемые схемы. Прежде чем превратиться по своим проявле- 
ниям в переключательную схему, нейроноподобные «логические» элементы 
проходят период самообучения, результат которого будет зависеть от свойств 
сигналов, поставляемых в такую схему из среды, либо от других элементов. 
Самообучение состоит в том, что нейроноподобные элементы накапливают 
статистические данные о входных сигналах и принимают некоторое решение 
о том, закономерны такие сигналы или нет. Одну и ту же нейросетевую 
конструкцию можно обучить выполнению нескольких разных «программ». 


Языковые идентификаторы. Способность сети из описанных нейронов 
ассоциировать образы, т. е. формировать образы совпадающих событий, ав- 
томатически приводит к возникновению возможности выработки ассоциа- 
ций образов, например ассоциации образов реальных объектов с образами 
некоторых других более доступных для использования объектов — звуков, 
изображений, и других сигналов, играющих вербальную роль. Эти образы 
вербальных объектов могут использоваться для замены образов реальных 
объектов и составляют основу разнообразных языковых эффектов. Это очень 
обширная тема, которая нами только начинает разрабатываться. Некоторые 
наши предварительные результаты будут представлены в гл. 4 «Языковые 
явления». 


3.2.12. Инженерные проблемы синтеза подсистемы ФРО 


Выше мы показали, как может работать система ФРО, построенная на ней- 
ронах. Эти схемы были выведены из условий, в которых работают нервные 
системы живых организмов. Мы рассматриваем эти схемы как модель распо- 
знающей части нервной системы. Задача, биологов — вынести суждение о том, 
соответствует ли эта модель биологическим данным. 

С инженерной точки зрения подсистема ФРО представляет собой блок, на 
входе которого имеется т входов, через которые можно подавать бинарные 
сигналы от датчиков. Выход подсистемы ФРО в ее нейросетевом исполнении 
представляет собой множество выходных полюсов (аналог множества, выход- 
ных нервных волокон — аксонов), на которых могут появляться единичные 
сигналы. Выходы закреплены «географически», т.е. связаны с определенными 
входами других подсистем и не меняют своего «адреса прописки», поэтому 
идентификация адреса выходного сигнала состоит просто в том, что этот 
сигнал связан с определенным выходом. Каждый выход интерпретируется 
как один возможный «образ»; напомним, что образом или сформированным 
образом мы называем только выход обученного нейрона. Если нейрон еще 
не обучен, то это соответствует лишь возможному образу, гипотезе об образе. 
Поэтому если на некотором выходе подсистемы ФРО сигнал «0», то это 
означает либо то, что данный образ не сформирован, либо то, что данный 
образ сформирован, но в данный момент не распознан. Если на некотором 
выходе в данный момент сигнал «1», то это означает, что данный образ 
распознан, тем самым понятно, что он сформирован. Отсюда сформированные 
образы — это те выходы подсистемы ФРО, на которых хотя бы раз появлялся 
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сигнал «1». С точки зрения других подсистем управляющей системы, которые 
используют выходные сигналы подсистемы ФРО, разница между сформиро- 
ванными и несформированными образами состоит лишь в том, что сигналы, 
проходящие через выходы, соответствующие сформированным образам, в ко- 
нечном счете создают обратные связи в системе «управляющая система — 
объект управления — среда», и могут возвращаться на входы управляющей 
системы, пройдя через другие подсистемы, исполнительные устройства, среду 
и датчики. Выходы, соответствующие несформированным образам, не обра- 
зуют обратных связей, а составляют, временно или навсегда, что-то вроде 
тупиков, «стоков» в распространении сигналов в системе. Понятно, что в таком 
варианте реализации подсистемы ФРО количество образов, которые может 
сформировать подсистема, не превышает числа ее выходов, с точки зрения 
внешнего наблюдателя. Если учесть, что не от каждого нейрона внутри под- 
системы ФРО проведена связь на выход, то можно сказать, что число образов, 
которые подсистема ФРО может сформировать, не превышает числа ее нейро- 
нов (если мы используем только нейроны рассмотренных типов). Но реальное 
число сформированных образов будет гораздо меньше числа нейронов, так 
как множество нейронов составляет «пробное» множество возможных образов, 
множество гипотез, а реально существующими образами окажется только 
некоторое их подмножество. Сказанное справедливо, если мы не используем 
каких-либо механизмов динамического формирования нейросети в процессе 
жизни системы. В этом случае число нейронов, сформированных образов 
и выходов подсистемы ФРО может изменяться, что следует учитывать при 
конструировании других подсистем управляющей системы. 

Если же при конструировании прикладной системы управления будет ре- 
шено использовать в качестве подсистемы ФРО какой-либо иной, не нейро- 
сетевой вариант самообучаемой системы распознавания, то можно сказать, 
что на выходе подсистемы ФРО должна появляться информация о каждом 
вновь сформированном образе в виде его идентификатора с очередным по 
порядку номером, например О;, где 1 = 1,2,.... В терминах теории рас- 
познающих систем — должен динамически формироваться алфавит классов. 
Далее должно указываться, распознан данный образ в текущий момент или 
не распознан. Это можно делать бинарными сигналами 1 и 0, присваивая их 
идентификатору. Например, О; = 0, если образ не распознан, и О; = 1, если 
образ распознан. Другие подсистемы будут работать с текущим алфавитом 
классов, т. е. с множеством сформированных образов. 

Вернемся к нейросетевому способу реализации подсистем ФРО на базе 
рассмотренных нейронов. Поскольку каждый нейрон можно рассматривать 
как логический дискретный элемент, то очевидно, что в такой нейросети 
должны возникать эффекты, присущие цифровым логическим схемам, что 
создает соответствующие проблемы при конструировании прикладных систем. 
Рассмотрим некоторые из таких проблем. 


Синхронизация работы нейронов в подсистеме. Как уже говорилось 
выше, временные задержки в работе нейронов, по нашему представлению, 
принципиально важны для того, чтобы нейроны могли формировать об- 
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разы пространственно-временных процессов и, главное, образы причинно- 
следственных явлений. В таких образах иногда очень важна точная временная 
привязка сигналов. С этим связана возможность, например, иметь хороший 
музыкальный слух, уметь точно управлять движением своего тела и т. д. 
Для такой точной синхронизации работы коллектива нейронов, по-видимому, 
необходим источник синхронизирующих импульсов, который подается на ней- 
роны некоторых подсистем. В биологии известно, что электроэнцефалография 
показывает наличие колебательных процессов с несколькими модами. Именно, 
различают гамма-ритм с частотой > 35 Гц, бета-ритм с частотой 13-30 Гц, 
альфа-ритм с частотой 8-13 Гц, тета-ритм с частотой 4-8 Гц, и дельта-ритм 
с частотой 0.5-3.5 Гц [18]. Причем высокочастотные гамма- и бета-ритмы 
особенно проявляются в состояниях эмоционального возбуждения, умственной 
и физической деятельности. С нашей точки зрения эти ритмы и могут играть 
роль синхроимпульсов, особенно необходимых при динамической умственной 
и физической деятельности, чтобы согласовать во времени работу нейронов 
распознающей системы, а также согласовать работу распознающей системы 
и системы принятия решений. Однако биологи не обращают внимания на необ- 
ходимость согласующего ритма в нервной системе, а пишут, что в целом 
природа ритмических процессов в биологических системах во многом не ясна, 
а знания об их механизмах часто носят умозрительный характер. Напомним, 
что это уже второй колебательный процесс, необходимость которого в нервной 
системе логически следует из ее устройства, соответствующего нашей модели. 


Переходные процессы в подсистеме ФРО и согласование работы 
подсистем. Пусть в нейросетевой подсистеме ФРО находится много уже 
обученных нейронов различных порядков. Подадим на вход подсистемы неко- 
торый прообраз. Мы увидим, что от слоя к слою нейронов в сторону увели- 
чения порядка нейронов и от такта к такту начнет распространяться волна 
распознанных образов. Одновременно каждый сработавший нейрон посылает 
отключающий сигнал назад, к нейронам, пославшим ему на предыдущем 
такте «прямой» сигнал. Получив такие отключающие сигналы, нейроны мень- 
ших порядков отключаются на следующем такте, т.е. вслед за «прямой» 
волной сигналов о распознанных образах с отставанием в два такта идет 
волна отключающих сигналов, освобождающая нейроны от поддержания уже 
не актуальных сигналов. Этот процесс закончится, когда будут распознаны 
сформированные «конечные» образы наибольших порядков. 

Если наблюдать при этом за выходами подсистемы ФРО, то мы увидим, 
как по некоторым из них начнет распространяться волна единичных сигналов 
в сторону выходов больших порядков, а за ней будет распространяться волна 
отключений единичных сигналов. Через некоторое количество тактов процесс 
остановится, и останутся некоторые единичные сигналы на выходах больших 
порядков. Это и есть конечные образы, распознанные в данной ситуации. 
Только теперь можно по этим распознанным образам принимать решение. Тем 
самым, можно говорить о существовании переходного процесса в подсистеме 
ФРО. Для завершения такого переходного процесса необходимо определенное 
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время. Очевидно, что этот эффект требует согласования во времени действий 
различных нейросетевых подсистем. 

Согласование по времени работы различных нейросетевых подсистем с уче- 
том времени их переходных процессов можно осуществлять разными спосо- 
бами. Например, можно использовать некоторую буферную схему (тоже скон- 
струированную из нейронов) в составе самой подсистемы ФРО, которая будет 
пропускать на выход подсистемы ФРО только сигналы, которые установятся 
в ней после окончания переходного процесса. Такая схема использовалась нами 
в системе управления мобильного робота, которая будет рассмотрена ниже. 
Можно организовать в управляющей системе еще один вид синхроимпульсов, 
регламентирующих передачу сигналов между подсистемами через такие такты 
времени, когда заведомо завершатся переходные процессы. Однако в этом 
случае надо учитывать необходимый темп работы управляющей системы, его 
постоянный или переменный характер. Возможны и другие решения. 


3.2.13. Методика построения подсистем ФРО 


Система ААУ имеет сложное строение, как и каждая из ее подсистем, включая 
подсистему ФРО. Мы считаем своей заслугой то, что к настоящему времени по- 
казали, что такие системы могут работать и как они могут быть устроены. Во- 
просы же разработки эффективной методики построения прикладных систем 
такого рода пока остаются до конца не решенными, что вполне естественно. 
Тем не менее, нами построено уже достаточно много прототипов прикладных 
систем ААУ и накоплен некоторый опыт. В этом разделе мы опишем подходы, 
которые мы разработали и которыми пользовались при создании прикладных 
систем. 

Но прежде всего мы хотим высказать свое убеждение в том, что методика 
синтеза оптимальных систем ААУ вообще вряд ли может быть предложена. 
Причина в следующем. Система ААУ понимается нами как модель нервной 
системы живого организма. Всем известно, что живые организмы чрезвычайно 
сложны и разнообразны. Можно ли говорить о том, что существует какая-либо 
«методика» построения живых организмов? Да, она есть у Природы, это 
путь естественного эволюционного развития видов с использованием генного 
механизма передачи наследственности. Каждый живой организм, живущий 
сегодня, это лишь последнее на сегодняшний день звено в непрерывной и очень 
длинной цепочке развития предков его вида. Мы не знаем, ни где начало этой 
цепочки, ни когда и как были созданы первые живые организмы. Эта «ла- 
боратория», из которой тянутся нити к каждому ныне живущему организму 
до последней мухи и мельчайшего микроба — некая таинственная область 
в пространстве и времени (рис. 3.42). Мы не знаем, появился ли на свете 
хотя бы один живой организм вне этой «лаборатории» и после того акта, 
творения. Все живое, что мы наблюдаем сегодня, — это только непрерывное 
размножение, развитие, приспособление и гибель созданных тогда первичных 
обитателей биосферы. Актов сотворения живого из неживой материи мы еще 
никогда не наблюдали. 
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Рис. 3.42. Абсолютно каждый живущий нынче организм связан непрерывной 

цепочкой своих предков с неким первичным организмом, созданным в какое-то 

отдаленное время. С тех пор, по-видимому, не было создано ни одного нового 

живого организма. Тем самым Природа демонстрирует пока только один способ 

конструирования организмов — длительное эволюционное развитие из простейшего 
первичного образования 


Можно ли сказать, что наблюдаемый нами процесс оптимизации абсолютно 
успешен и все животные построены оптимально? Ответ — нет, потому что 
мы видим, как постоянно исчезают целые виды животных, которые не смогли 
выжить в реальных условиях, не успели приспособиться к изменениям условий 
существования, оказались неоптимальными. 

Итак, мы не видим, чтобы в природе образовывались новые виды животных 
из неживой материи. Мы не видим этих творческих актов Природы по синтезу 
совершенно новых живых организмов, тем более — как-то «аналитически» 
рассчитанных и оптимизированных для текущих реалий. Ну, скажем, вдруг бы 
мы увидели, что появились совершенно нового вида живые организмы, сразу 
приспособленные для жизни, скажем, на крышах зданий или на обочинах шос- 
сейных дорог. Ничего подобного не было замечено. Возможен ли вообще способ 
создания живых организмов из неживой материи в наше время? Может быть, 
это было возможно некогда в каких-то уникальных условиях? Может быть, это 
были элементарные одноклеточные, а все, что мы видим теперь, — это только 
результат длительной жизни и непрерывного развития тех организмов? Из 
сказанного следует, что даже если бы мы имели очень четкое представление 
о том, как может быть устроен живой организм, вовсе еще не следовало 
бы, что существует некий способ его построения сразу в готовом развитом 
виде, кроме способа постепенного эволюционного развития из простейшего 
организма в течение жизни миллионов поколений его потомков. Поэтому 
задача синтеза прикладной системы ААУ для заранее заданных условий сразу 
в готовом виде — это нечто, чему мы не видим аналога, в природе, и неизвестно, 
имеет ли эта задача иное решение, кроме эволюционного развития. 
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Возможно, что природой найден единственно возможный способ конструи- 
рования автономных адаптивных управляемых объектов — бесконечное репро- 
дуцирование программы, записанной в хромосоме, сопровождающееся ее мо- 
дификацией и развитием. При этом сами объекты управления (организмы) яв- 
ляются только вспомогательной структурой, поддерживающей вечную жизнь 
программы, записанной в хромосоме. По необходимости эта вспомогательная 
структура, — тело организма, должно быть устроено так, чтобы оно росло под 
управлением программы хромосом, определяло удачность либо неудачность 
хромосомы (фитнес-функцию), обеспечивало ее передачу потомкам, и вовремя 
погибало. 

Если это так, то естественный «принцип конструирования жизни» су- 
щественно отличается пока от принципа конструирования всех искусствен- 
ных систем, создаваемых человеком. Мы приблизились бы к естественному 
принципу, если бы придумали такую технологию производства, при кото- 
рой наши искусственные механизмы рождались бы от уже поживших эк- 
земпляров, наследовали их удачные и неудачные свойства, вырастали бы, 
приспосабливались и умирали, а удачные экземпляры передавали бы свои 
свойства потомкам. Такой подход к конструированию техники остается пока 
в области фантастики. Однако некоторые его черты естественным образом 
пробиваются в современной технологии. Так, в искусственных механизмах, 
машинах и других созданных людьми объектах можно усмотреть процесс 
эволюционного развития. Например, никогда не изобретается сразу сложная 
и оптимально устроенная машина. Все начинается с небольших и неловких 
простых моделей, которые постепенно развиваются и усовершенствуются. От 
комнатной модели планера к «Аэробусу», от настольной модели двигателя — 
к современному автомобилю, от процессора к микропроцессору — так идет 
эволюция искусственной природы. При этом роль генов, сохраняющих и пере- 
дающих информацию об удачных и неудачных свойствах предыдущих вариан- 
тов искусственных объектов, играет научно-информационное обеспечение тех- 
нологии и промышленности, научно-техническая и технологическая докумен- 
тация. Информация от поколения к поколению передается не в хромосомах, 
ав книгах, чертежах и т. п. Этим же путем, как мы надеемся, пойдет и развитие 
систем автономного адаптивного управления (ААУ). Однако необходимость 
в переходе к эволюционному способу конструирования искусственных систем 
уже ощущается непосредственно и реализуется, в частности, в методах эво- 
люционной оптимизации систем. Эти методы стали возможными благодаря 
компьютерам, позволяющим реализовать эволюционный поиск не в реальной 
жизни, а в виртуальной реальности — в компьютерах, моделируя «жизнь» 
и эволюцию многих поколений. Эти методы эволюционной оптимизации уже 
активно используются в современной индустриальной технологии. 

Мы понимаем, что находимся только в начале пути, ведущего к созданию 
эффективной методики синтеза систем ААУ, но все же предлагаем некоторые 
решения, которые можно применять при конструировании прикладных систем 
автономного адаптивного управления. Из сказанного следует, что существуют 
два подхода к построению систем ААУ. Первый подход базируется на «гене- 
тической» информации, представленной в уже имеющихся научных и других 
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знаниях. Обычно такой подход называют использованием априорной инфор- 
мации. Второй подход состоит в применении методов поисковой эволюцион- 
ной оптимизации, которые моделируют естественный способ эволюционного 
развития систем с передачей информации посредством специально для этого 
образованных «хромосом». И конечно, наиболее общая методика создания 
прикладных систем ААУ состоит в объединении этих двух подходов — вначале 
на основе имеющейся априорной информации и знаний создается первый 
вариант прикладной системы ААУ, а затем производится его эволюционное 
развитие: как автоматическое — методами типа генетических алгоритмов, 
с передачей информации через искусственные хромосомы, так и аналитиче- 
ское — с использованием привычных способов отбора и хранения полезной 
информации в виде документации, публикаций и т. п. 


Построение подсистемы ФРО на основе априорной информации. 
Как уже понятно читателю, система ААУ, предназначенная для управления 
объектами, свойства которых заранее мало известны, является поисковой 
системой. Таковыми являются и каждая из ее подсистем, включая подсистему 
ФРО. Для каждой подсистемы можно указать ее «пространство поиска». Про- 
странством поиска для подсистемы ФРО является признаковое пространство, 
соответствующее возможным показаниям используемых датчиков. В этом про- 
странстве подсистема ФРО должна найти неслучайные — относительно часто 
повторяющиеся объекты — образы с коррелирующими компонентами. (Под 
«коррелирующими» сигналами везде ниже будем понимать повторяющуюся 
пространственно-временную структуру сигналов.) Задача состоит в том, чтобы 
использовать доступную априорную информацию о свойствах объекта управ- 
ления, имеющихся датчиков и исполнительных устройств, чтобы как можно 
точнее локализовать и сузить в пространстве поиска те области, в которых 
лежит искомый закон управления, и затем «нацелить» систему ААУ на эти 
области, поручив ей найти точное положение искомых закономерностей. 

Дальнейшие действия зависят от того, каким из способов решено строить 
подсистему ФРО. Возможный выбор состоит из двух вариантов. Первый — это 
применение какого-либо из известных методов автоматической классифика- 
ции, распознавания с самообучением, включая применение традиционных ис- 
кусственных нейронных сетей. Второй — построение подсистемы ФРО на базе 
рассмотренных нейронов типов І, П, Ш или ТУ. 

О применении традиционных методов автоматической классификации 
и распознавания уже говорилось выше. 

Возможности применения в подсистеме ФРО традиционных искусственных 
нейронных сетей (ИНС) существуют, но сталкиваются с рядом специфических 
проблем. Основная проблема состоит в том, что в своем классическом вари- 
анте ИНС не являются самообучаемыми системами распознавания. Работа, 
с ИНС разбивается на два этапа. Вначале ИНС требуется обучить на № 
примерах из обучающей выборки. И только после того, как ИНС начнет 
демонстрировать требуемое качество распознавания (например, будет успешно 
распознавать 99% примеров из обучающей выборки), ее можно начинать 
использовать в реальной системе управления. При этом обычно ИНС уже 
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нельзя переобучать в процессе работы в рабочем режиме. Попытка дообучить 
ИНС распознавать какой-либо новый (№ + 1)-й образ вдобавок к тому, что 
она уже умеет распознавать, обычно приводит к тому, что ИНС забывает 
все, что она уже умела. Этот эффект называется «катастрофическим забы- 
ванием». В этом случае требуется заново переобучать ИНС на новой обуча- 
ющей выборке из № + 1 примера. Понятно, что это свойство традиционных 
ИНС в корне противоречит требованиям системы ААУ обучаться «на ходу» 
в реальном времени управления, постоянно обучаясь новым и новым образам. 
Нами предпринимаются попытки реализовать систему ААУ, в том числе ее 
подсистему ФРО на каких-либо ИНС, в частности, ИНС на основе адаптивного 
резонанса [20], но решения оказываются достаточно тяжеловесными, пока еще 
мало удовлетворительными. 

Построение подсистемы ФРО на основе разработанных для метода ААУ 
моделей нейронов зависит от априорной информации и выбранной модели 
нейрона. 

При конструировании прикладной системы управления ААУ для заданного 
объекта по имеющейся априорной информации надо постараться, по возмож- 
ности, понять следующее. 


А. Какие по смыслу образы могут понадобиться для управления данным 
объектом? Не забываем, что на распознавание образов именно определенного 
смысла настроены от рождения системы распознавания живых организмов 
определенного вида, и это есть результат поиска и оптимизации их рас- 
познающих систем в результате длительной эволюции и развития данного 
вида. Мы же при конструировании вместо длительной эволюции вида можем 
воспользоваться имеющейся теорией управления, наблюдениями и другой 
доступной информацией. Поняв, какие именно образы могут понадобиться 
для управления данным объектом, можно начинать конструирование та- 
ких образов одним из способов, рассмотренных выше. Например, это могут 
быть образы пространственных, пространственно-временных, периодических, 
причинно-следственных процессов. Здесь можно применять весь рассмотрен- 
ный нейросетевой базис — нейроны и синапсы всех рассмотренных типов. На- 
пример, учет временных задержек удобно осуществлять с помощью нейронов 
типа П. 


Б. Надо попытаться максимально точно локализовать пространства поиска 
образов, сделать эти пространства максимально узкими. Например, мы за- 
ранее знаем, что понадобятся образы 1-й производной некоторой величины, 
но не знаем, какие именно значения будет принимать эта производная. Надо 
определить диапазон возможных значений искомой величины. Этот диапазон 
и будет пространством поиска. В пределах именно этого диапазона и следует 
разбить сеть из нейронов, являющихся «гипотезами», или «пробными» обра- 
зами. 


В. Во всем гипотетическом множестве образов следует выделить следую- 
щие диапазоны-множества: 
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1. Диапазоны несовместных образов. В каждом таком диапазоне может 
быть распознан только один образ, а диапазон соответствует нашей 
неопределенности знания относительно того, где именно будет найден 
действительно существующий образ. 

2. Множества зависимых образов. Это те пары, тройки и т. д. диапазонов 
образов, которые, по нашему предположению, являются зависимыми 
друг от друга, между ними есть какая-то закономерность. 

3. Зашумленные образы. Это те образы, которые проявляются только 
статистически, будучи зашумленными какой-то помехой. 


Для каждого диапазона несовместных образов следует создать множество 
пробных образов — гипотез, чтобы найти действительно существующий образ. 
Если пользоваться нейронами типа І, то следует взять столько нейронов, 
сколько гипотез мы хотим проверить. Если пользоваться нейронами типа Ш, 
то на каждый такой диапазон можно использовать только один нейрон. 

Если образы не зашумлены и не нужно искать образ с помощью накопления 
статистики, то, возможно, задачу распознавания такого образа, можно решить 
простой регистрацией диапазона, в который попадает наблюдаемая величина, 
т. е. использовать простую «геометрическую» систему распознавания. 

Если предполагается, что для управления понадобятся зависимые образы, 
то надо строить образы 2-го и выше порядков, которые будут искать неслучай- 
ные зависимости в распознавании таких образов. Так, если есть два множе- 
ства образов и предполагается, что существует зависимость между какими-то 
из них, то при отсутствии всякой дополнительной информации и при исполь- 
зовании нейронов типа І придется строить образы 2-го порядка в количестве, 
равном мощности декартова произведения этих множеств. При использовании 
нейронов типа, Ш можно обойтись в этом случае существенно меньшим числом 
нейронов. 

Определение таких параметров нейронов, как пороговые значения М, поро- 
говые функции р(№) и другие, нужно производить либо из рациональных сооб- 
ражений, либо методом подбора. Аналитический расчет необходимых порогов 
М для нейронов сети, при заданных свойствах источника прообразов, прово- 
дился Л. Земских. Было показано, что при синтезе сети из нейронов типа І 
заранее указать значение порога М, необходимого для принятия решений 
нейроном, нельзя. Можно лишь указать интервал, в котором лежит значение 
порога. В целом, метод аналитического расчета оптимальных параметров 
нейросетей для системы ААУ пока не разработан. Нам представляется более 
удобным способ расчета параметров нейросетей для систем ААУ посредством 
генетических алгоритмов, как это будет показано ниже. 


Построение подсистемы ФРО методами эволюционной оптимизации. 
Сегодня известно несколько методов эволюционной оптимизации. Нами ис- 
следовались возможности трех из них: решение, связанное с организацией 
поискового направленного динамического «выращивания» нейросети, исполь- 
зование генетических алгоритмов и использование самообучаемых конечных 
автоматов. 
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Поисковое направленное динамическое «выращивание» нейросети. 
В разд. 3.2.3 был упомянут принцип Таутса и Кемпбела, который отражает 
способность биологического нейрона улавливать совпадающие сигналы. Если 
предположить, что подобное свойство существует и у совокупности нейронов, 
то это свойство могло бы лежать и в основе организации направленного 
роста нейросети. Действительно, биологические сведения о пренатальном (до 
рождения) и постнатальном (после рождения) формировании и росте нервной 
ткани у живых организмов описывают активное формирование нервной ткани 
в эти периоды жизни организма. При этом формирование явно является 
целенаправленным. Новые нейроны и связи образуются именно там, где они 
нужны данному организму и, что особенно важно, — нужны именно в конкрет- 
ных условиях его существования. Например, согласно [28], у новорожденного 
животного, у которого надета повязка на глаза, заметно страдает развитие 
мозга. Это показывает, что распознающая нейросеть строится динамически 
с учетом конкретных условий существования организма. 

Нам представляется, что возможный механизм такого целенаправленного 
роста нейросети связан с тем, что активно используемые нейроны, получал 
ющие входные сигналы и производящие выходные сигналы, особенно корре- 
лирующие сигналы, выделяют в окружающую среду некоторый химический 
медиатор, который и стимулирует рост нейронов и связей именно в ближайшей 
к данному нейрону области (рис. 3.43). 

Тем самым, такое «облако» медиатора, образованное над зоной активно (и, 
видимо, главное — коррелированно) работающих нейронов, представляет со- 
бой специальную надстройку над уже готовой нейросетью, основная функция 
которой — определить направление наиболее актуального дальнейшего роста 
нейросети, проводя сбор статистических данных (проявляющихся в повышен- 
ной концентрации медиатора). 


Зона роста новых 
нейронов и связей 


Рис. 3.43. Новые нейроны и связи растут там, где концентрация медиатора, повы- 
шена активно работающими нейронами 
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В работе [21] был успешно реализован алгоритм выращивания нейронопо- 
добной сети подсистемы ФРО для системы ААУ. Для этого нейросеть ФРО 
оснащалась специальной программной надстройкой («матрицей событий»), 
накапливавшей статистические данные о степени коррелированности срабаты- 
ваний уже существующих нейронов. По результатам работы этой надстройки 
осуществлялось порождение новых нейронов и добавление их в структуру 
нейросети путем их присоединения именно к тем нейронам, которые работают 
коррелированно. Это и обеспечивает появление в сети ФРО новых нейронов, 
которые отражают наиболее вероятные образы. 


3.3. Синтез Базы Знаний системы ААУ 
и подсистемы принятия решений 


Среди сложных, агрегированных пространственно-временных образов, кото- 
рые может формировать управляющая система, полезно выделить один очень 
важный вид образов, который мы будем называть «знаниями». Пусть прообраз 
обычного пространственно-временного образа, состоит из временной последо- 
вательности нескольких образов, которая имеет закономерный характер и от- 
ражает некоторый наблюдаемый управляющей системой (УС) закономерный 
процесс в среде, на который УС может влиять. «Знание» состоит из трех 
образующих — образ условия, затем образ действия, затем образ результата. 
Например, если распознан образ камня в руке, затем распознан образ действия 
«бросаю камень», то после этого будет распознан образ летящего камня. 
Здесь важно наличие именно трех компонент, причем вторая, центральная 
компонента отражает некоторое действие, которое может совершить данная 
управляющая система. В данном примере УС может дать команду бросить 
камень, а может и не дать такой команды. Наличие этой второй компоненты — 
«действия», обеспечивает «свободу воли» управляющей системы и дает ей воз- 
можность принимать решения (бросать камень или не бросать), т.е. управлять. 

В общем случае каждая из трех компонент образа «знания» может быть 
представлена различной сложности образами или совокупностями образов. 
Например, образ «условия» иногда может быть очень сложным и составным. 
Так, знание хирурга о том, что при определенной операции он может сделать 
некоторый определенный надрез, подразумевает выполнение очень сложного 
условия. Должны быть распознаны образы того, что пациент страдает опреде- 
ленным недугом, что налицо определенные симптомы, что выполнен комплекс 
определенных условий и подготовительных работ, и т. д. и т. п. И только рас- 
познав этот образ или совокупность этих образов, хирург может решиться или 
не решиться сделать данный надрез. Его решение будет основано на знании 
того, что имеется много прецедентов, когда в подобных случаях такой над- 
рез приводил к определенным следствиям (потом будут распознаны такие-то 
и такие-то образы), и что совокупность этих ожидаемых образов лучше, чем те 
образы, которые последуют, если данного надреза не сделать. В данном случае 
образы «условия» и «следствия» являются сложными, а образ «действия» — 
простым (один надрез). В других случаях образ «действия» может быть тоже 
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сложным и составным. Например, принимается решение, что в сложившихся 
условиях надо делать такую-то операцию, за которой последуют такие-то 
следствия. Здесь решение принимается о «действии», которым является вся 
операция — сложная последовательность многих и многих определенных дей- 
ствий. Однако «знание» может состоять и из очень простых образов «условия», 
«действия» и «результата». Например, если вижу кнопку дверного звонка, то, 
нажав ее, услышу звук звонка. Главное здесь — не сложность образов, а нали- 
чие именно этих трех компонент: условие, действие, результат. Упорядоченную 
в некотором отношении совокупность таких «знаний» будем называть Базой 
Знаний (БЗ). Везде ниже термин База Знаний будет использоваться только 
для обозначения рассматриваемой подсистемы, предназначенной для работы 
в составе системы ААУ. 

Можно предложить несколько вариантов инженерной проблемы построе- 
ния такого рода Базы Знаний, отличающихся своими возможностями, спосо- 
бом реализации и сложностью. 

Рассмотрим эти варианты. 


3.3.1. Табличный способ построения Базы Знаний 


Табличный способ построения БЗ является наиболее простым, он удобен для 
многих практических прикладных систем ААУ. Условия его применимости, 
достоинства и недостатки окончательно сформулируем после того, как рас- 
смотрим данный способ. 

Пусть образы «условия» являются несовместными, т.е. в каждый текущий 
момент # состояние объекта управления характеризуется не более чем одним 
распознанным образом, который обозначим через О; (#), где і = 1,2,..., №. 
При этом прообразы этих образов могут быть как угодно сложными. Мно- 
жество О = {О} является алфавитом классов или множеством «образов 
условия». Если подсистема ФРО является автоматическим классификатором 
и может формировать новые образы в течение работы системы, то М№ является 
переменной величиной. 

Пусть подсистема принятия решений в момент # может выбрать только 
одно из К действий, которые обозначим Г, (0), ј = 1,2,..., К. Каждое действие 
может представлять собой что угодно, от элементарного поворота руля до 
определенной сложной программы или стратегии поведения. 

Пусть результаты совершения действия могут быть представлены образами 
из множества 


О5=10,.(0)}, где 2= 1,2,..., Г. 


Это есть множество «образов результатов». 

Создадим прямоугольную таблицу № х К следующего вида (см. рис. 3.44). 

Организуем подсистему формирования Базы Знаний, которая будет на- 
блюдать за процессом управления и следить за повторяемостью троек (1, ј, 2), 
соответствующих событиям (О,(? – 2), 2;(#— 1),0,()). 

Назначим некоторое пороговое число М. Если некоторая тройка (4, 1, 2) 
повторилась не менее М раз, то в клетку (і, 1) записываем число 2. 
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Номер + распознанного образа условия О; (0) 
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Рис. 3.44. Представление простой Базы Знаний в форме прямоугольной таблицы 


Так, например, если было положено, что М = 10 и в клетке (2,1) таб- 
лицы БЗ появилось число 5, то это должно означать следующее: управляющая 
система автоматически обнаружила, что было не менее 10 прецедентов, когда 
при распознавании образа Оз и совершении на следующем такте действия Ру 
каждый раз после этого на следующем такте распознавался образ Оу. При 
этом число М = 10 должно было быть выбрано так, что такое количество 
случаев для нас можно считать достаточным, чтобы полагать, что с большой 
вероятностью и в следующем (М + 1)-м случае данная реакция объекта 
управления сохранится. 

Если в некотором столбце 1 таблицы БЗ еще ничего не записано, это может 
означать, что УС либо еще ни разу не попадала в состояние, характеризуемое 
образом О;, либо попадала, но еще не накопила уверенного опыта — не было 
еще найдено ни одного действия, которое бы М раз привело к одинаковому 
результату, либо это означает, что объект управления не обладает в данном 
состоянии закономерными реакциями ни на одно из действий П0;. 

Если в некоторый момент в некоторой клетке таблицы еще ничего не за- 
писано, то это означает, что управляющая система еще не обнаружила данной 
закономерности, либо, что никакой закономерной реакции объект управления 
в данном случае не демонстрирует, либо то, что мы заложили в подсистему 
формирования БЗ правило, которое не выявляет действительно существую- 
щую закономерность, и следует изменить правило. 
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Очевидно, что можно придумать множество правил заполнения таб- 
лицы БЗ эмпирическими знаниями. Эти правила могут отличаться крите- 
риями, определяющими требования к достоверности данных, записываемых 
в БЗ. Так, если мы положим М = 1, это будет означать, что в БЗ мы 
собираемся записывать информацию о единичных прецедентах и потом будем 
полагаться на них при принятии решений. В природе лучшие правила записи 
в БЗ находятся в процессе эволюционной оптимизации, когда организмы 
с неудачными правилами погибают либо вследствие того, что правила недо- 
статочно надежны (порог М мал) либо обучение слишком медленное (порог 
М высок). 

Одна из проблем построения такого рода Базы Знаний связана с природой 
множеств 9 и 9. В зависимости от содержательного смысла прикладного 
примера возможны различные отношения между этими множествами. Рас- 
смотрим следующие случаи. 


1. 91 = 9. = 9, множества образов условия и образов результатов 
совпадают, и действие управляющей системы осуществляет отображение из 
множества (0) в само это множество. Это, видимо, в основном объекты управ- 
ления, имеющие искусственную природу. Например, таким свойством обладает 
игральный кубик — его исходное состояние представлено одним из 6 вариан- 
тов и воздействие на кубик переводит его в одно из этих же б вариантов. 
Этот случай интересен тем, что здесь возможно многошаговое планирование 
и принятие решений, предполагающих несколько последовательных действий. 


2. 91 ПО. = © (пусто) или эти множества не совпадают, но пересекаются. 
Этот случай более типичен для естественной среды. Возможно, что при этом 
могут рассматриваться отношения самих образов условий и результатов друг к 
другу. Вернемся к примеру с водителем. Каждый водитель знает, что, повернув 
на перекрестке за угол дома, он увидит продолжение улицы. В том числе — 
в незнакомом городе. Множество 9 — это множество объектов, которые води- 
тель распознает, подъехав к перекрестку. Это могут быть очень конкретные об- 
разы. А образ 95 здесь — это образ продолжающейся за поворотом улицы. Это 
сравнительно размытый и неопределенный образ, сложившийся у водителя 
как обобщение всех тех результатов поворотов, которые он совершил в своей 
жизни. В этом случае трудно планировать будущие действия на несколько 
шагов вперед. Например, водитель, даже максимально точно определив свою 
начальную позицию, вряд ли рискнет проехать поворот с закрытыми глазами. 
Здесь можно использовать рассмотренный выше формализм «сведений, срав- 
нимых на общность». 

Другая проблема построения БЗ такого рода связана с тем, что, как 
уже неоднократно указывалось выше, закономерным результатом совершения 
действия может быть распознавание не одного, а целого множества образов. 
В этом случае строить БЗ в виде прямоугольной таблицы становится трудно. 

Наконец, еще более трудным случаем является ситуация, когда законо- 
мерность совершения действия проявляется лишь в вероятностном характере 
появления результата. Например, удается только определить распределение 
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вероятностей появления тех или иных образов-результатов. В этом случае 
требуется применить более сложную форму Базы Знаний. 


3.3.2. Подсистема принятия решений по табличной БЗ 


Принятие решений на основе табличной БЗ (мы коснемся только самого 
простого варианта, соответствующего рис. 3.44) основано на том предположе- 
нии, что записанные в БЗ закономерности, найденные в прошлом, будут дей- 
ствительны и в ближайшем будущем. Иначе говоря, эмпирически найденные 
в прошлом закономерности 


(0:02 – 2), ВАЕ- 1),0.(0)) 


могут относиться и к будущим моментам времени: если в некоторый момент 
времени # будет распознан образ О;(#), то совершение действия Р,;(# + 1) 
приведет к распознаванию образа О, (1+2). Тем самым, используется гипотеза 
о квазистационарности свойств системы «среда — ОУ — УС», т. е. предпола- 
гается, что свойства системы изменяются, но не слишком быстро. На самом 
деле требование, чтобы система была квазистационарной, не является прин- 
ципиальным. Если свойства среды или объекта управления изменяются, то 
База Знаний постепенно должна перестроиться. Но если свойства системы 
будут изменяться слишком быстро, то управляющая система будет постоянно 
переучиваться, изменяя содержимое БЗ. Однако при этом, пытаясь управлять, 
она будет принимать решения, полагаясь на устаревшие неверные знания, 
и качество управления будет низким. Возрастет вероятность того, что объект 
управления попадет в непригодные для него условия. 

Механизм принятия решения состоит в следующем. В текущий момент і 
подсистема ФРО распознает образ О;(®). В таблице БЗ выделяется столбец, 
соответствующий этому образу. Теперь управляющая система должна решить, 
какое действие ДР; + 1) ей следует инициировать в следующий момент 
+ - 1. Для этого УС просматривает выделенный столбец БЗ, чтобы узнать, 
какие результаты к моменту Ё + 2 ей следует ожидать после совершения 
каждого из альтернативных действий. Результаты в такой БЗ представлены 
в виде идентификаторов образов О,(# + 2). Если мы имеем дело со слу- 
чаем, когда 9 П 95 = @ (пусто), т.е. когда множество образов исходных 
состояний не совпадает с множеством образов результатов действий, и мы 
отказываемся от многошагового принятия решения, то из всех характеристик 
образов результатов УС может интересовать только эмоциональная оценка 
5. образа результата О,. Поэтому УС должна выбрать то действие, для 
которого эмоциональная оценка 5, образа результата О, максимальна из всех 
оценок образов в данном столбце БЗ. Выбрав такое действие и дав команду 
исполнительным органам реализовать его в момент +1, управляющая система 
обоснованно ожидает, что в результате в будущий момент времени і + 2 будет 
распознан образ, который повысит эмоциональную оценку текущего состояния 
на наибольшую величину из всех возможных на момент Ё + 2. 

В первом приближении можно сказать, что выбор действия не зависит от 
эмоциональной оценки текущего состояния. Так, если для момента {+2 можно 
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выбрать состояния с оценками от +2 до +5, то выберем, конечно, состояние 
с оценкой --5 независимо от того, какой была оценка текущего состояния. Если 
она была выше +5, то в момент Ё + 2 останется сожаление о том, что раньше 
было лучше, а если она была ниже, чем +5, то будем радоваться ее повышению. 
Но в любом случае мы будем знать, что выбрали лучшее из возможного. 

При работе с такого вида БЗ возникает ряд специальных случаев и про- 
блем, которые надо разрешить. Эти проблемы связаны с содержанием данных, 
имеющихся в БЗ в момент принятия решений. Рассмотрим некоторые из них. 

Пусть после выбора столбца БЗ и подстановки эмоциональных оценок всем 
образам результатов оказалось, что имеется несколько образов с одинаковыми 
максимальными значениями. Какой из них следует выбирать? Если у нас 
нет никакой дополнительной априорной информации о природе процессов, 
происходящих в этой системе, т. е. в среде, в объекте управления или в УС, то 
в этом случае можно производить случайный выбор действия из тех, которые 
соответствуют этим нескольким максимумам. Если же имеется некоторая 
дополнительная информация, которая позволяет как-то различить эти альтер- 
нативные действия и упорядочить их по какому-то дополнительному свойству, 
то надо производить выбор с учетом этого свойства. Например, все возможные 
действия можно упорядочить по затратам энергии на их реализацию исполни- 
тельными органами. В этом случае надо выбирать то действие из отобранных 
по БЗ, которое требует минимального расхода энергии на его реализацию. Воз- 
можны и другие критерии, например предсказуемость результата действия, 
точность его реализации, сила производимого возмущения, и т. п. Следует 
подумать также о том, не следует ли включить этот контролируемый признак 
в состав распознаваемых образов, снабдив УС соответствующим датчиком. 

Напомним, что всякий случайный выбор, из какого бы множества он ни 
производился, всегда работает на обучение системы, так как случайный выбор 
пополняет множество экспериментальных данных, в которых УС может найти 
закономерность. Итак, в общем случае, если на множестве оценок выбираемых 
действий находится несколько экстремумов, то выбор из них следует произво- 
дить случайным способом. 

Поскольку управляющая система ААУ является самообучаемой системой, 
то ее База Знаний, как правило, находится в частично заполненном состоянии. 
Тем самым, информация для принятия решений является не до конца опре- 
деленной. Вспомним, что у управляющей системы есть две целевые функции: 
а) выживание и б) накопление знаний. С целью «выживания» УС выбирает 
действие с максимальной эмоциональной оценкой результата по тому алго- 
ритму, который мы рассмотрели. А цель «накопление знаний» достигается 
алгоритмами, которые включаются тогда, когда появляется неопределенность 
выбора. Рассмотрим некоторые такие случаи. 

Прежде всего обратим еще раз внимание на то, что именно память 
Базы Знаний и является тем основным (но не единственным) поисковым 
пространством, которое старается заполнить управляющая система. УС 
должна стремиться к тому, чтобы в каждом столбце таблицы БЗ были 
заполнены все клетки, потому что в этом случае УС может найти способы 
управления и пути перехода из любого возможного состояния в состояния 
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Эмоциональная оценка 
образа результата действия, / 


4 


> 
Номер возможного действия, 7 


Рис. 3.45. Эмпирически найденные значения эмоциональных оценок образов- 

результатов в зависимости от совершаемых возможных действий и при условии, 

что распознан соответствующий образ исходного состояния. Управляющая система, 
должна найти и выбрать действие с максимальной оценкой 


с высокими эмоциональными оценками. Наиболее важными для УС являются 
клетки столбца БЗ, содержащие номера образов с максимальными в данном 
столбце оценками. Именно их УС и должна стремиться найти. Если нарисовать 
график, где по оси абсцисс расположены номера действий, а по оси ординат — 
значения эмоциональных оценок образов результатов, соответствующих 
данным клеткам, то при полностью заполненном столбце мы увидим график 
некоторой функции (рис. 3.45). 

Если на момент принятия решения вся такая кривая оценок известна, то 
остается только найти ее глобальный максимум, который укажет на номер 7 
искомого действия. Здесь, как указывалось выше, возможна, только проблема, 
которая возникает, если имеется несколько действий с одинаковыми макси- 
мальными оценками. В этом случае можно выбирать одну из них случайным 
способом. 

Если же на момент принятия решения эта кривая известна не полностью, 
то, в соответствии с целью «накопление знаний», управляющей системе сле- 
дует постараться «узнать» эту кривую, в первую очередь — положение ее 
экстремальных точек, позволяющих в этой ситуации совершать наилучшее 
действие. Говоря о цели «накопления знаний», мы отчасти имеем дело с за- 
дачей оптимизации, где управляющей системе следует найти максимальное 
значение К предъявленной неизвестной функции, зависящей от аргумента, 7. 
Как известно, эта задача может быть решена различными способами: полным 
перебором, методом градиентного спуска, коллективом обучаемых конечных 
автоматов (М. Л. Цетлин и его последователи, например А. Н. Рапопорт [22]), 
генетическими алгоритмами или другими методами поисковой оптимизации. 
На базе таких методов можно организовать различные поисковые алгоритмы. 
Однако ситуация с поиском экстремума осложняется наличием целевой функ- 
ции «выживание», когда «эмоциональное состояние» управляющей системы 
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Эмоциональная оценка 
образа результата действия, А 


> 
Номер возможного действия, 7 


Рис. 3.46. Пример случая, когда не очевидно, следует ли выбирать известное 

действие с предсказуемым результатом, но заведомо низкой оценкой (сплошная кри- 

вая), либо, рискнув, выбрать действие с неизвестным результатом, который может 
оказаться лучше известных (пунктирная кривая) 


зависит от результата эксперимента, направленного на получение нового знал 
ния. Суть проблемы состоит в следующем. Пусть в графике оценок рассматри- 
ваемого столбца Базы Знаний (рис. 3.46) часть данных уже имеется (сплошная 
линия), но все эти действия имеют низкие оценки результатов, а часть данных 
еще отсутствует (пунктир). Управляющая система попадает в эту часть БЗ 
и должна выбрать действие. Здесь очевидно, что вначале надо решить вопрос, 
выбирать ли максимум из уже известных действий с плохими результатами 
или следует выбрать одно из действий с неизвестным результатом в надежде 
найти действие с оценкой более высокой, чем уже известные действия. Выбор 
одного из известных действий даст гарантированный, но плохой результат, 
а выбор неизвестного действия даст неизвестный результат, но он может 
оказаться лучше, чем известные. Тем самым, проблема поиска экстремума 
неизвестной функции в рассматриваемом случае осложняется еще стоимо- 
стью решений (эмоциональная оценка результата) и вероятностью получения 
результата (детерминированный результат или неизвестный). Здесь следует 
предложить некоторый алгоритм принятия решений, который обоснованно 
для каждого конкретного случая выбирал бы стратегию обучения (выбираем 
одно из неизвестных действий) или стратегию выживания (выбираем извест- 
ное действие). Можно предложить разные алгоритмы такого рода, в которых 
выбор между стратегиями обучения и выживания мог бы зависеть от таких 
аргументов, как оценка текущего состояния, производная этой оценки, содер- 
жание уже имеющихся знаний (известны действия с высокими или низкими 
оценками) и т. п. Этот алгоритм и обеспечивает обучение управляющей си- 
стемы непосредственно в процессе управления. 

При составлении алгоритма добывания новых знаний нужно учитывать 
еще и возможность изменения оценок образов-результатов. Например, если 
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в результате поиска управляющая система нашла в основном только действия, 
обеспечивающие переходы к состояниям с лучшими оценками, то такая управ- 
ляющая система попадет в затруднительное положение, если качественные 
оценки образов-результатов изменятся. В этом случае управляющей системе 
надо будет «рулить» к другим образам-результатам, оценки которых стали 
большими, но она может не найти в своей Базе Знаний способов попадания 
к таким образам. Ситуация выглядит примерно так, как если бы кто-то 
составлял для себя карту метро некоторого города, но отмечал там только 
пути к «лучшим» (например, нужным) для него станциям. Если ситуация 
изменится и ему понадобится некоторая иная станция, то он, возможно, 
не найдет в своей Базе Знаний пути к ней. 

Выбор стратегии управления в текущий момент в некоторых случаях 
может быть обоснован рациональным прогнозом о содержании еще отсутству- 
ющих знаний, если таковой можно сделать. Это весьма важная тема, поэтому 
представим ее в специальном разделе. 


3.3.3. Вывод новых знаний из имеющихся знаний. 
Производство гипотез 


Выбор стратегии управления (случайный или детерминированный выбор дей- 
ствия — обучение или выживание) может быть сделан обоснованно, если 
в управляющей системе (УС) задать возможности автоматического анализа 
имеющихся в БЗ знаний и вывода из них новых знаний — знаний над знаниями, 
метазнаний. 

Задача формального вывода новых знаний на основе неполных знаний, 
уже имеющихся в Базе Знаний, состоит, на примере БЗ в табличной форме, 
в следующем. Пусть имеется таблица БЗ, частично уже заполненная эмпи- 
рически найденными знаниями, — значения оценок результирующих образов 
записаны не во всех клетках таблицы. Требуется с помощью формальных 
методов заполнить недостающие значения. Другими словами, требуется, чтобы 
управляющая система, оказавшись в конкретных условиях и не совершая 
практических действий, могла заранее предположить, какой результат будет ее 
ожидать, если она совершит то или иное конкретное действие. Речь идет, таким 
образом, о предсказании уже не данных, а знаний. Исходными данными для 
такого предсказания является здесь совокупность ранее полученных знаний. 
Очевидно, что поиск закономерностей на множестве знаний возможен только 
при наличии определенной заранее заданной гипотезы, которая определяла, 
бы, что именно мы понимаем под закономерностью, поскольку закономерности 
могут быть самыми разными, а алгоритм может искать только определен- 
ные закономерности. Здесь имеет место сильная зависимость возможности 
решения задачи от способа представления знаний в БЗ, поскольку гипотезы 
о закономерностях знаний формулируются в терминах того представления зна- 
ний, которое используется в данной БЗ. Итак, для возможности формального 
поиска и вывода новых знаний в БЗ требуется учесть, определить или задать: 
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Рис. 3.47. Графическое отображение обученной Базы Знаний, в которой можно 
обнаружить свои закономерности — знания над знаниями 


а) способ кодировки и представления знаний в БЗ, 
б) пространство поиска закономерности — определенное подпространство 
таблицы БЗ: 


— столбец таблицы БЗ, 
— строка таблицы БЗ или 
— другое определенное подпространство таблицы, 


в) гипотезу о виде закономерности или видах нескольких закономерностей. 


Проиллюстрируем сказанное на содержательном примере. При построе- 
нии систем ААУ для некоторого класса объектов управления был исполь- 
зован такой способ кодировки данных в БЗ, при котором столбцы БЗ были 
упорядочены и соответствовали образам, отражающим близкие по значе- 
нию параметров состояния объекта управления, а строки были упорядочены 
по возрастанию силы и направления управляющего воздействия актуатора. 
В каждой клетке таблицы цветом кодировалось значение «эмоциональной» 
оценки результирующего образа. При проведении испытаний методом полного 
перебора (испытывались все возможные точки пространства БЗ) было обнару- 
жено (рис. 3.47), что для разных объектов управления данного класса знания 
в таблице БЗ проявляют несколько закономерностей, которые обнаруживают 
себя при такой кодировке. Именно: 


1. Данные в каждом столбце можно представить как сумму длиннопе- 
риодного «холма» и небольших вариаций с характерным периодом 
в 2-3 точки (закономерность в пределах столбца таблицы). 

2. Все множество столбцов БЗ разбивается на вытянутые вертикально 
«холмы» равной ширины с центральной симметрией относительно цен- 
тра холма (закономерность в пределах подпространства, таблицы). 

3. Центры всех холмов хорошо аппроксимируются полиномом, близким 
к прямой линии, пересекающей все пространство таблицы БЗ в диа- 
гональном направлении (закономерность в пространстве всей таб- 
лицы БЗ). 

4. Во всех трех случаях принималась также «гипотеза о монотонности» 
[Щ, согласно которой в случае, если объект управления представляет 
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собой черный ящик, предполагалось, что близкие по номеру воздействия 
актуатора на, объект управления будут вызывать близкие его реакции. 


Эти закономерности, увиденные в опытных данных, получили свои содер- 
жательные объяснения — ответы на вопрос «почему происходит именно так?», 
что усилило надежность гипотез, которые на них были построены. Поэтому 
в последующих версиях этой управляющей системы появилась возможность 
уйти от полного перебора при обучении управляющей системы, а алгоритм 
принятия решений при достижении целевой функции «накопление знаний» 
строить так, чтобы исследование управляющей системой признакового про- 
странства происходило не полным перебором, но опиралось на найденные 
закономерности. Были предложены следующие варианты. 


1. Использование закономерности в столбце БЗ. При попадании в опреде- 
ленный столбец БЗ, управляющая система вначале выбирала действие слу- 
чайным способом и после М одинаковых опытов получала эмоциональную 
оценку результата, (рис. 3.48). Затем, при следующем попадании в этот стол- 
бец, пыталась найти направление, в котором изменение номера действия при- 
водит к увеличению оценки результата. В итоге управляющая система быстро 
находила экстремум и на этом прекращала поиск новых знаний для данной 
ситуации (для данного столбца БЗ). Если же в последующем эмпирические 
результаты переставали соответствовать записи БЗ, то они корректировались. 
Тем самым, управляющая система целенаправленно находила то действие, 
которое в данных условиях давало лучший результат. При этом она пользова- 
лась определенными гипотезами о закономерностях, которые были заложены 
в поисковый алгоритм. Здесь не только реализовывался алгоритм обучения 
и управления в одном процессе, и обучение шло не просто опытным путем, 


Рис. 3.48. Начало заполнения Базы Знаний. Скриншот экрана дисплея с модели- 
рующей программой 
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Рис. 3.49. База Знаний, заполненная актуальными знаниями в результате примене- 
ния целенаправленного алгоритма поиска. Скриншот экрана, дисплея с моделирую- 
щей программой 


но содержало в себе фазу автоматического предсказания результата, действия 
(когда управляющая система выбирала еще не известное действие, полагаясь 
на гипотезу о монотонности возрастания оценки результата в найденном ею 
направлении). БЗ, найденная в результате такого алгоритма принятия ре- 
шений (рис. 3.49), содержала в основном только полезные для управления 
знания, потому что управляющие воздействия, которые выбирала, УС, посте- 
пенно сходились к оптимальным. При таком «мягком» обращении с объектом 
управления он находится в некотором наиболее вероятном и естественном для 
него множестве своих состояний. Это отражается в том, что даже в обученном 
состоянии найденные знания занимают только часть Базы Знаний (рис. 3.49). 
Если же действия выбирать случайным способом, то они часто далеки от 
оптимальных, они «дергают» объект управления немилосердным образом, 
заставляя его попадать даже в самые маловероятные состояния, в которых 
он не окажется при правильном управлении. База Знаний при таком обучении 
может быть окончательно заполненной (рис. 3.47), однако большинство зна- 
ний оказываются излишними, они описывают очень маловероятные состояния 
и поведение объекта управления. И если можно обоснованно предположить, 
что вероятность востребования таких знаний при реальном управлении будет 
очень мала, то ими можно пренебречь, не тратя время на их приобретение. 


2. Использование закономерности в пространстве всей таблицы БЗ. Примем 
указанную выше гипотезу о том, что экстремальные точки каждого столбца 
группируются в пространстве таблицы БЗ около некоторой кривой, близкой 
к диагонали таблицы. Этот факт можно использовать для вывода новых 
знаний (предположений) о нахождении экстремума даже в пустом столбце, 


3.3. Синтез Базы Знаний системы ААУ и подсистемы принятия решений 197 


6) 


Рис. 3.50. Направленный поиск знаний, опирающийся на закономерности, обна- 

руживаемые в самих знаниях. В данном случае аппроксимация экстремальных по 

оценке «знаний» полиномом прогнозирует содержание еще не известных знаний (по 
дипломной работе Б. М. Магомедова) 


если по уже имеющимся данным удастся оценить положение этой кривой. 
Такую оценку можно выполнить, аппроксимируя частично найденные экстре- 
мальные точки некоторым полиномом (рис. 3.50 (а)). Точка, пересечения этой 
кривой со столбцом указывает на, наиболее вероятное положение экстремума в 
данном столбце (рис. 3.50 (6)). Поэтому при попадании ОУ в данный столбец 
управляющая система может начать поиск наилучших действий именно с этой 
точки, совершая пробные воздействия в некоторой ее окрестности, с учетом, 
при необходимости, вероятностных характеристик, описывающих наиболее 
вероятный разброс (дисперсию) пробных точек вокруг указанного центра 
(математического ожидания). 

Еще раз обратим внимание на то, что когда управляющая система некото- 
рым формальным способом вывела новые знания из знаний, уже имевшихся 
в БЗ, то эти новые выведенные знания еще не должны являться для УС до- 
стоверными знаниями, на которые можно вполне положиться при управлении. 
Такие знания являются пока только прогнозом реальных знаний, гипотети- 
ческими знаниями, которые надо еще проверить. Поэтому действие, которое 
управляющая система совершает в соответствии с такими формально выве- 
денными гипотетическими знаниями, надо рассматривать только как пробное 
действие и его результат записывать в БЗ только после того, как оно будет 
подтверждено статистически на практике или в соответствии с другим приня- 
тым для этого критерием. Аналогичная ситуация часто происходит и в нашей 
жизни: мы часто делаем предположение о результатах наших действий в неко- 
торых новых для нас условиях, в которых мы еще ни разу не оказывались. Мы 
понимаем, что ожидаемый в этом случае результат является гипотетическим, 
предполагаемым, и только после того, как опыт подтвердит или опровергнет 
наше предположение, мы более прочно и уверенно запоминаем эти знания. 
Часто предпринимаются специальные действия для того, чтобы проверить 
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Рис. 3.51. Найденный эмпирическим путем «закон управления» более точен, чем 
закон, выведенный аналитически, и позволяет управлять данным объектом управ- 
ления наилучшим способом. Пробелы в «знаниях» получились из-за того, что в этих 
диапазонах работает внешняя система управления, не давая УС ААУ обучиться. Так, 
нянька, делая что-то вместо ребенка, не дает ему возможности научиться этому делу 


такие предполагаемые, формально выведенные знания. Такие действия можно 
наблюдать в животном мире, у людей — как на бытовом уровне, так и в очень 
сложной деятельности, например, сюда относятся эксперименты в физике, 
экспедиции в геологии, географии и т. д. 

Главной целью добывания знаний опытным путем или посредством прогно- 
зирования с последующей экспериментальной проверкой является поиск зна- 
ний, наиболее важных для системы. В первую очередь — это знания, которые 
будут использоваться при управлении с целью «выживания» ОУ. Поскольку 
при принятии решений с этой целью выбираются действия, дающие наилуч- 
ший по эмоциональным, качественным оценкам результат, то, казалось бы, 
достаточно ограничиться поиском «наилучших» знаний. Например, в каждом 
столбце таблицы БЗ найти только действие с экстремальной оценкой, и тогда 
таблица БЗ превратится в кривую, имеющую смысл «закона управления» для 
данного объекта, (рис. 3.51). Именно такого вида закон управления и отыс- 
кивается обычно аналитически на основании решения уравнений, описывал 
ющих динамику объекта управления. Построение такой математической мо- 
дели и расчет закона управления требуют высококвалифицированного труда 
и дорого стоит. К тому же этот закон управления бывает только приблизи- 
тельным, поскольку построен на основе некоторых модельных представлений, 
обобщающих, аппроксимирующих реальные свойства объектов. А с помощью 
системы автономного адаптивного управления (ААУ) мы получаем искомый 
закон управления в его более точном виде. 

Эмпирически найденный закон управления можно в табличном виде «за- 
шить» в бортовую систему управления, и мы получим «детерминированную» 
УС, которая будет работать быстро и обеспечивать высокое качество управле- 
ния в случае, если свойства объекта управления не будут меняться. Последнее 
обстоятельство и является причиной, по которой требуется использование 
адаптивной системы управления. Если использовать детерминированный за- 
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Рис. 3.52. (а) База Знаний заданного объекта управления, полученная с примене- 
нием генетических алгоритмов, и (6) База Знаний, полученная в результате поиска 
методом полного случайного перебора. В случае (а) База Знаний занимает меньший 
объем в памяти, так как содержит только знания, которые пригодятся с наибольшей 
вероятностью, и не содержит знаний, которые, скорее всего, никогда не пригодятся 


кон управления, то в случае изменения свойств объекта управления таким зал 
коном не будет обеспечиваться необходимое качество управления. Применение 
же системы ААУ позволяет автоматически изменить закон управления. 
Очевидно, что можно говорить также о наиболее вероятных границах 
изменения свойств объекта управления, которым будет соответствовать неко- 
торая область пространства, Базы Знаний, где сможет располагаться «закон 
управления», соответствующий таким изменениям. Каким способом можно 
было бы оценить границы этого пространства? Помимо аналитического рас- 
чета, который может оказаться весьма трудным, можно предложить исполь- 
зование поисковых методов оптимизации. Например, нами для этой цели 
в работе [23] был успешно применен метод генетических алгоритмов (ГА). 
В сериях экспериментов порождались популяции моделей объекта управления 
с изменяющимися в допустимых пределах свойствами, и для каждого из них 
находилась оптимальная База Знаний. Критерием отбора являлось высокое 
качество управления, обеспечиваемое такой БЗ. В результате обсчета многих 
поколений популяций была найдена База Знаний с оптимальным ограничен- 
ным пространством. Тем самым, от БЗ были отсечены области поискового про- 
странства, в которых с большой вероятностью не мог лежать закон управления 
при любых допустимых изменениях свойств объекта управления (рис. 3.52). 


3.3.4. Нейроноподобная База Знаний 


Базу Знаний для системы ААУ можно построить также на основе 
рассмотренных выше нейронов. Используем свойство нейронов распознал 
вать пространственно-временной образ раньше, чем закончится предъяв- 
ление нейрону прообраза этого образа, рассмотренное выше в п. 3.2.11 
(см. рис. 3.35, 3.36). 

В Базе Знаний отдельный нейрон также будем использовать для решения 
всех основных задач анализа данных — выявления закономерности, распознал 
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Рис. 3.53. База Знаний в виде трехмерной матрицы нейронов 


вания закономерностей, действующих в текущий момент, и прогнозирование 
будущего на основе распознанной закономерности. 

Самый простой способ построения БЗ на основе описанных нейронов со- 
стоит в следующем. 

Как говорилось выше, элементарным знанием следует полагать тройку 
закономерных причинно-следственных событий вида 


(0:0 – 2),0;( – 1),0,.(2)), 


где О; суть образы «условия», Р; — образы действий, а О,(#) — образы 
результатов этих действий. 

Создадим сеть из нейронов в виде трехмерной матрицы (рис. 3.53). Одно из 
измерений матрицы пусть соответствует выходам всех нейронов, отвечающих 
за распознавание образов условий 0;(#—2), второе — образов действий Г; (#—1), 
а третье — образов результатов О, (0). В каждом узле матрицы разместим 
нейрон, п входов которого организуем так, как это показано на рис. 3.54. Пусть 
вся матрица как блок нейронов имеет множество выходов, которое составляют 
выходы всех нейронов. При этом выход нейрона соответствует по смыслу 
действию Р;. 


Рис. 3.54. Нейрон, лежащий в узле матрицы Базы Знаний 
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Как обычно в системе ААУ, БЗ используется параллельно в двух режимах, 
которые могут, например, на каждом такте следовать друг за другом попере- 
менно, образуя фазу обучения и фазу принятия решений. 

В фазе обучения на входы матрицы подаются сигналы, взятые из предысто- 
рии, именно с тактов #—2, #{—1 иё. Это сигналы О; (1—2), 2; (#—1), О.(®) по всем 
1, ј и 2. Если в матрице найдутся такие нейроны, для которых все три входных 
сигнала окажутся равными «1», то такие нейроны начнут самообучение. 

Обратим внимание, что для обучения не играет большой роли, как именно 
выбиралось действие П; — выбиралось ли оно по некоторой глубокомысленной 
стратегии или просто случайно, от стратегии обучения здесь зависит только 
скорость и полнота обучения. Сейчас для нас важно лишь то, что этот нейрон 
будет «чувствовать» реакцию среды на это воздействие в данных условиях. 
Другими словами, обучение БЗ происходит в результате пробных воздействий 
на среду, эти воздействия могут быть случайными или не случайными, 
среда в любом случае будет отвечать на них в соответствии со своими 
свойствами. Поэтому для обучения БЗ мы можем использовать некий 
генератор случайных воздействий, который как внешняя по отношению к БЗ 
подсистема может генерировать случайные сигналы 0;. Для передачи этих 
сигналов на выход БЗ в фазе обучения и используется замыкание входа 20; 
на выход Р; (см. рис. 3.54). 

Если среда имеет некоторые закономерные свойства и они начнут прояв- 
ляться в том, что при определенных условиях О и определенных действиях 
В среда демонстрирует определенные реакции О, то соответствующие 
нейроны в матрице БЗ могут обучиться. Каждый обученный нейрон, лежащий 
в матрице БЗ с определенными координатами, и представляет собой элемен- 
тарное знание. А множество всех обученных нейронов составляет знания БЗ. 

После того как некоторые нейроны обучатся, они будут способны распо- 
знавать свои образы (знания) при наблюдении всех трех компонент вход- 
ного сигнала, сообщая об этом своим единичным выходным сигналом. Хотя 
в таком состоянии нейрон уже сам способен производить выходной сигнал, 
однако решение все еще зависит от внешнего генератора (пусть и случайных) 
воздействий. У функционирующих нейронов порог постепенно снижается и, 
начиная с некоторого момента, он опускается ниже величины (п — 1)/т. Если 
теперь на такой нейрон подать только два сигнала, именно О; и О,, то 
этот нейрон выдаст единичный выходной сигнал, который и будет указывать 
на действие О;. При этом мы можем заставить нейрон строить обоснованный 
прогноз относительно возможного будущего. Именно, пусть в момент Ё подси- 
стема ФРО распознала образ условия О!, т. е. сигнал О! равен «1». Испытаем 
нейрон, имеющий в матрице БЗ координаты (+, } 2). Подадим на его вход О, 
пробный сигнал «1», О"+? = 1, который имеет смысл вопроса: 


«можем ли мы в данной среде вызвать распознавание образа О**? = 1, если 
р Р 1+1 
воздействуем на среду действием О Е ?» 


Если данный нейрон откликнется единичным выходным сигналом Р; = 1, 
то это будет означать ответ «Да, можем». Если нейрон не откликнется, это 
будет означать «Нет, не можем». 
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Наиболее простой способ принятия решения состоит в следующем. Выходы 
распознающей системы ФРО подаем на те слои матрицы БЗ, которые 
соответствуют распознанным в момент Ё образам О! = 1. Упорядочим все 
образы результатов О, в порядке убывания величины их эмоциональной 
оценки. Поскольку мы хотели бы из любого исходного состояния-условия 
попасть в состояние с самой большой эмоциональной оценкой (сразу попасть 
в дамки и выиграть миллион), то подаем пробный единичный сигнал на тот 
слой матрицы БЗ, который соответствует образу результата с максимальной 
эмоциональной оценкой. Если какой-либо нейрон в матрице откликнется 
единичным сигналом, то он и укажет на то действие 7, с помощью которого 
можно попасть сразу в дамки. Если же ни один нейрон не откликнется, то 
подаем пробный единичный сигнал на слой образов-результатов с меньшей 
эмоциональной оценкой. Если обученный нейрон находится — совершаем 
соответствующее ему действие. Если нет — подаем пробный сигнал на еще 
менее «хороший» образ результата. И так до тех пор, пока не найдем 
обученный нейрон. Он и укажет нам на действие, совершив которое, мы 
перейдем в состояние, «лучшее» по эмоциональной оценке из всех тех 
состояний, в которые мы можем перейти в текущих условиях. 

При этом, конечно, может оказаться, что в текущей ситуации совершить 
можно только действие, которое вызовет распознавание образа с отрицатель- 
ной оценкой. Надо ли совершать такое действие? Здесь нужно принимать 
еще одно решение — нужно ли совершать такое найденное «лучшее» дей- 
ствие. Алгоритм принятия этого решения может базироваться на очевидных 
соображениях. Во-первых, можно сравнивать оценку прогнозируемого образа 
с оценкой текущей ситуации. 


1. Если обе оценки отрицательны, но результирующее состояние все же 
лучше текущего, то можно в него перейти. 

2. Если результирующее состояние немного хуже текущего, то тоже можно 
перейти в него, поскольку другое, «лучшее» детерминированное дей- 
ствие для текущей ситуации неизвестно. 

3. Если оценка результата «лучшего» действия намного хуже оценки 
текущего состояния, то можно принять решение не совершать этого 
действия, а совершить неизвестное действие, выбрав его случайным 
способом из всех действий с неизвестными результатами в надежде на то, 
что «повезет». 

4. Случайный выбор действия можно производить не просто «на авось», но 
использовать имеющуюся априорную информацию и доступные сред- 
ства прогнозирования для того, чтобы случайный выбор сделать по 
возможности целенаправленным. Здесь в качестве априорной информа- 
ции можно использовать, например, уже имеющееся содержимое Базы 
Знаний. Если какими-либо методами, в том числе — эвристическими, 
удается предложить поиск закономерностей в содержимом БЗ, то эти 
закономерности можно использовать для обоснованного прогноза от- 
носительно тех знаний, которые еще отсутствуют в БЗ. Эвристики 
здесь полезны в силу того, что закономерности в БЗ сильно зависят 
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не только от их наличия в среде и объекте управления, но и от способа 
представления знаний, выбранного для построения БЗ. Даже если вы 
примените какие-либо методы автоматического поиска закономерностей, 
то все равно необходимо указать базис, или правило, определяющие вид 
тех закономерностей, которые вы собираетесь искать в знаниях БЗ. 


При работе с образами, имеющими отрицательную оценку, надо иметь 
в виду также возможность использования образов вытеснения. Это важное 
понятие в системах ААУ. Пусть в результате совершения некоторого действия 
перестает распознаваться ранее распознанный образ, имеющий отрицательную 
оценку. Можно организовать формирование образа вытеснения, который начи- 
нал бы распознаваться тогда, когда переставал распознаваться первый образ. 
Образ вытеснения в данном случае имеет положительную эмоциональную 
оценку. При этом действие, имеющее целью вызвать распознавание образа 
вытеснения, направлено на вызов образа с положительной оценкой и позволяет 
работать с ним так же, как с действием, вызывающим распознавание обычного 
образа с положительной оценкой. 

Возможна также ситуация, что при подаче на БЗ пробного возбуж- 
дения одновременно могут откликаться несколько нейронов, указывающих 
на несколько действий, совершение которых не только возможно в текущих 
условиях, но и приводит к результатам с одинаковой по качеству эмоцио- 
нальной оценкой. В этом случае подсистема, стоящая на выходе БЗ и подси- 
стемы принятия решений, должна выполнять определенную процедуру отбора 
только одного из найденных альтернативных действий. Процедура отбора 
может состоять, например, из набора следующих правил: 


— если ни один нейрон не откликнулся, действие выбираем случайным 
способом; 

— если откликнулся один нейрон, то совершаем указанное им действие; 

— если откликнулось несколько нейронов, то случайным способом выби- 
раем одно из этих действий. 


В частности, работа того генератора случайных воздействий, который 
использовался на тактах обучения БЗ, и есть частный случай работы данной 
процедуры. 

Рассмотрим также более общий случай, когда исходная, текущая ситуация 
представлена некоторым множеством образов, и ситуация, которая вызывается 
совершением действия, тоже представлена некоторым множеством образов, 
имеющих как положительные, так и отрицательные оценки. В этом случае 
описанный выше алгоритм принятия решений, когда в БЗ по очереди ини- 
циировались образы-результаты в порядке убывания их оценок и тем самым 
отыскивалось действие, дающее лучший результат, становится неудобным. 
Неудобство связано с тем, что при выборе действия мы не учитываем всех 
его последствий. Для таких систем можно использовать другой алгоритм 
принятия решений, более сложный, но дающий более обоснованный результат, 
более полно учитывающий последствия совершения альтернативных действий. 
В этом алгоритме используем тот же самый куб БЗ, на который в фазе 
принятия решения подаются сигналы на слои, соответствующие распознанным 


204 Глава 3. Синтез моделей нервных систем 


в текущий момент образам. Для принятия решения следует по очереди 
подавать пробные сигналы на все входы возможных действий. Для каждого 
пробного сигнала следует просуммировать оценки всех образов результатов, 
которые откликнутся, и запомнить эту сумму. Суммируются как положи- 
тельные оценки, так и отрицательные. Когда будут испытаны все действия, 
следует сравнить запомненные суммы и выбрать наибольшую. Для исполнения 
следует выбрать то действие, которое соответствовало наибольшей сумме, 
потому что именно это действие обещает вызвать такой комплекс образов, 
которые в сумме дадут наибольшее увеличение эмоциональной оценки. Такое 
действие будет учитывать и то, что мы потеряем, и то, что мы получим 
в результате совершения действия, и в сумме это будет лучший вариант 
из возможных. Такой вариант использования нейроноподобной БЗ во многом 
соответствует общему представлению о Базе Знаний и способе принятия 
решений, которые будут рассмотрены ниже при описании Базы Знаний в виде 
бинарных деревьев. Очевидно также, что в этом случае при принятии решения 
можно предложить более эффективный способ перебора пробных действий, 
чем полный последовательный их перебор. В частности, вначале может быть 
использована процедура отделения в кубе БЗ тех слоев, которые содержат 
нейроны, соответствующие действиям, адекватным текущей ситуации. Далее, 
в отделенном множестве могут быть по формальным признакам отделены 
действия, соответствующие наиболее эффективным действиям и т. п. 

Подчеркнем, что обучение нейроноподобной Базы Знаний может происхо- 
дить в течение всей жизни системы, параллельно с принятием решений. При- 
нимать решения можно и при совершенно пустой БЗ, в этом случае решения 
будут приниматься случайным способом. По мере появления в БЗ обученных 
нейронов решения будут становиться все более обоснованными, опираться 
на эмпирические знания. Во многих ситуациях при принятии решений будет 
в разных формах использоваться случайный компонент выбора (например, 
при выборе одного из альтернативных наилучших действий), что будет способ- 
ствовать дальнейшему развитию системы, увеличивая вероятность появления 
новых знаний. 

Очевидно, что возможны и другие правила организации работы как данной 
процедуры принятия решений, так и самой рассмотренной нейроноподобной 
Базы Знаний. Рассмотренный здесь вариант построения нейроноподобной БЗ 
и подсистемы принятия решений был нами смоделирован на компьютере 
и показал свою работоспособность, именно способность к самообучению и при- 
нятию решений на основании эмпирически накапливаемых знаний. 

Обучение такого рода БЗ происходит с насыщением, которое вызывается 
такими причинами, как: 


— ограниченное число нейронов в матрице БЗ, 

— ограниченное число закономерностей, которые действуют в данной при- 
кладной системе, объекте управления и среде, 

— ограниченное число образов, которые может сформировать подсистема 


ФРО в данной прикладной системе, 
— ограниченное число действий, которые может совершать исполняющий 


орган данного объекта управления, и другими причинами. 
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Ограничения, накладываемые каждой из указанных причин, могут быть, 
если не устранены, то существенно ослаблены различными путями, что позво- 
ляет повышать эффективность таких систем. 

Следует также сказать, что при реализации такого рода нейроноподоб- 
ной БЗ на базе цифровых дискретных моделей нейронов могут возникать 
различные трудности, обычные для цифровых и логических схем, с которыми 
вполне можно бороться соответствующими инженерными методами и прие- 
мами. 


3.3.5. Представление Базы Знаний для систем ААУ 
в виде бинарных деревьев и автоматическое 
наполнение ее эмпирической информацией 


Известно, что при работе с бинарной информацией удобно использовать такую 
структуру для представления данных, как бинарное дерево. Напомним, что 
структура данных может называться деревом, если она представляет собой 
связный граф без циклов, для любой пары различных вершин которого су- 
ществует одна и только одна цепь, соединяющая эти вершины. В ориентиро- 
ванном дереве имеется только одна вершина (корень), не имеющая входящих 
ребер. Ориентированное дерево называется бинарным, если каждая вершина 
имеет не более двух исходящих ребер. 

Данные, составляющие Базу Знаний системы ААУ, являются бинарными 
в нескольких отношениях. Прежде всего, образы «условия» О; (#) индициру- 
ются бинарными сигналами: «1» означает, что образ сформирован и распознан 
в текущий момент, а «0» означает, что образ сформирован, но не распознан 
в текущий момент, либо то, что он еще не сформирован к текущему моменту. 
Действия О;(Р) тоже могут описываться бинарными величинами, например 
«1» может означать, что данное действие выбирается в данный момент, а «0» — 
что это действие не выбирается. Работа с образами результатов О, (#), в свою 
очередь, также может быть организована с помощью бинарных сигналов: так, 
«1» может означать, что в результате совершения соответствующего действия 
ожидается, согласно БЗ, что данный образ будет вызван, а «0» или «—1»можно 
использовать для обозначения того, что данный образ в результате совершения 
действия будет вытеснен (перестанет быть распознанным). 

При построении Базы Знаний для системы ААУ в виде бинарного дерева 
можно учесть следующие обстоятельства. Как отмечалось выше при обсуж- 
дении табличной формы БЗ, возможны ситуации, когда несколько действий 
управляющей системы приводят к одинаковым результатам, если под резуль- 
татом понимать образы, которые распознаются УС после совершения дей- 
ствия. Очевидно, что одинаковыми эти результаты будут казаться только дан- 
ной управляющей системе и на ее уровне развития. Какая-нибудь другая УС, 
которая умеет распознавать больше образов, увидит разницу в результатах. 
Для наглядности представим, что для инициирования одного из разных вари- 
антов воздействий актуатора на среду управляющая система должна нажать 
одну из кнопок на пульте управления актуатором. Все множество кнопок 
составляет множество всех вариантов воздействия актуатора на среду в один 
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момент времени. Будем называть одну такую кнопку степенью свободы выход- 
ных воздействий УС. А действием теперь будем называть такое подмножество 
степеней свободы (кнопок), которые в условиях распознавания одинаковых 
образов условия приводят к распознаванию одного и того же множества 
образов результата. Например, пусть для того, чтобы вызвать распознавание 
образа света, управляющая система, может с одинаковым результатом нажать 
одну из кнопок №3, 5, 8 или 15 (положим, что эти кнопки включают разные 
осветительные приборы). Причем никакой разницы для данной УС с точки 
зрения распознаваемых ею образов в этих результатах не будет. Назовем здесь 
действием множество степеней свободы (3, 5, 8, 15). 

Итак, пусть управляющая система располагает актуатором, позволяющим 
реализовать № степеней свободы (11,12,...,0,..., Им). Обозначим это мно- 
жество идентификатором 09%, назовем его корневым действием и поместим 
в корень бинарного дерева: 


Р? = (1,059,250 йм). 
Множество (иа, 1ь,...,13,.::,0с) в записи 
р; — нае | 


будем называть значением действия Г, (2). 

Все бинарное дерево снабдим специальным предикатом — условием С'(#), 
С(0) є {ДА, НЕТ}. Это есть текущее условие применимости данного де- 
рева БЗ. Если в текущий момент условие выполняется, С'(Ь) = ДА, значит, 
данное дерево БЗ можно применять для принятия решений, т. е. это дерево 
справедливо в этих условиях. Такое условие должно быть понятно управля- 
ющей системе, для этого условие должно быть представлено в терминах уже 
сформированных образов. Образы О;(Р) могут принимать значения 1 или 0, 
что показывает, распознан тот или иной образ или не распознан. Поэтому усло- 
вие применимости данного дерева БЗ должно быть записано в виде предиката, 
(логического выражения), составленного из значений образов. 

Например, условие С(#) может быть таким: 


С(0) = (02(0&0Оз(0) У Оз(Ё- 1). 


Это условие будет равно ДА, если в момент Ё распознаны образы 0» и Оз, либо 
в предыдущий момент был распознан образ Оз. Кроме того, в большинстве 
случаев следует учитывать, что образы условия и образы результатов — это 
не одни и те же образы. Образы результатов являются более общими, чем 
образы условий, и могут конструироваться из образов условий. 

Если в УС не сформирован ни один образ, то условие С(Р) пустое, 
С(® = Ов, где Ор есть образ пустоты, означающий, что УС не знает ни 
одного образа, и тем самым понимает, что какое бы действие она (УС) ни 
совершила, она снова перейдет в состояние, в котором она ничего не будет 
распознавать. Поэтому УС в этой ситуации абсолютно все равно, какую сте- 
пень свободы актуатора инициировать. 
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Будем считать, что если УС приняла решение совершить действие 


РК = (Фе, у.е), 


это означает, что для исполнения следует случайным способом выбрать одну 
степень свободы из значения этого действия, т. е. выбрать одну и из множе- 
ства (Ка... М, ..., 06). 

В процессе управления БЗ в виде бинарного дерева растет и одновременно 
участвует в принятии решений. Покажем, как это происходит. 

Пусть БЗ в начале жизни объекта управления совершенно пуста, т. е. 
УС не знает ни одного объекта, представленного образом и, соответственно, 
не знает ни одного действия, которым можно воздействовать на какой-либо 
объект. Единственный распознанный в этих условиях образ — это образ 
«пустоты» Ор с его эмоциональной оценкой бе. Поэтому условие примени- 
мости БЗ С(1) = Ог тоже состоит только из этого образа. Принимая решение 
в этих условиях, УС может с равной вероятностью выбрать любую степень 
свободы из полного их списка, т.е. «действием», которое УС может совершить, 
является корневое действие 


П (га оа Ш), 


Этому исходному состоянию соответствует дерево БЗ, представленное 
на рис. 3.55, в нем представлен только корень. 

Руководствуясь такой БЗ, управляющая система совершает случайные 
воздействия на среду, случайно выбирая и инициируя степени свободы 
м, 12,...,Му,... или им. Пусть через некоторое время жизни объекта управ- 
ления его подсистема ФРО сформировала первый образ некоторого объекта, 
неслучайное появление которого она выявила. Для нас неважно, какой именно 
это образ, достаточно знать, что этот образ связан с некоторым нейроном, 
который его распознает, т. е. «адрес» этого образа определяется просто фик- 
сированным положением данного нейрона в сети. Чтобы идентифицировать 
образы в нашем дереве БЗ, мы будем нумеровать их в порядке появления 
на сцене — в порядке их формирования. Поместим идентификатор этого 
образа О на 1-й уровень бинарного дерева (слева на рис. 3.56). Сюда мы 
будем помещать образы результатов действий. Эмоциональная оценка 51 этого 
образа, находится описанным выше способом. Напомним, что ее значение либо 
задано сразу, если этот образ сформирован и помещен в БЗ изначально, либо 


о. 8, 

Ог 52 
г --- 
О И 
г == 
р К 


Рис. 3.55. Бинарное дерево БЗ в исходном состоянии — полное отсутствие знаний 
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9. 5 С(@ = Ог 
0 
Оз 52 Ру = (01,12,...,10,..:,0№) 
— 
27 Уһ 
Е====-- те мысге====== = 
127 ~ 1 
О: 51 а | ЕИЕАОНАИ | 
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Рис. 3.56. Бинарное дерево БЗ после записи в него информации о первом сформи- 
рованном образе 


находится в процессе анализа влияния данного образа на общую эмоциональ- 
ную оценку объекта управления. Так или иначе, эта оценка всегда определена, 
например, в первый момент она может быть равна нулю, и потом постепенно 
уточняться. 

Теперь УС знает о существовании в системе некоторого объекта, который 
она может распознавать в виде образа О}, и этот образ приносит эмоциональ- 
ную оценку 51. Очевидно, что если оценка 51 отрицательная, неприятная, 
то УС хотела бы избавиться от нее. Если оценка положительна, то УС хотела 
бы снова вызывать ее. Для этого следует в первом случае вытеснить образ, 
во втором случае — вызвать распознавание образа. Но и то и другое можно 
осуществить только с помощью воздействий на среду, которые инициируются 
посредством выбора степеней свободы и„. Управляющей системе теперь пред- 
стоит найти такие степени свободы и,, которые воздействуют на прообраз 
образа О. Выбирать УС может только из списка 


Ру ею 


Стратегия поиска может быть любой и соответствовать наличию какой-либо 
дополнительной априорной информации. Если никакой априорной информа- 
ции нет, то остается стратегия поиска методом случайных проб. Итак, пусть, 
например, методом случайных проб УС пытается найти, какие из степеней 
свободы и, способны влиять на прообраз образа О. Этот поиск подчинен 
целевой функции «накопление знаний». Пусть в результате таких поиско- 
вых действий управляющая система обнаружила, что воздействие на среду, 
соответствующее некоторой степени свободы и„, например, из, способно так 
повлиять на среду, что в результате вызывается распознавание образа О}, при 
условии, что он не был распознан, С(®) =|О! (здесь знак «|» означает логи- 
ческое отрицание). Пусть этот элемент знания удовлетворяет управляющую 
систему своей достоверностью, например, он статистически достоверен. Этот 
найденный факт записывается в БЗ в следующем виде (рис. 3.57). Если сте- 
пень свободы и, приводит к распознаванию образа О1, то у корневого действия 


0 
Ру = (м, 12,... И... ИМ) 
образуется действие — левый сын 


р = (0), 
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Рис. 3.57. УС нашла способ вызвать распознавание образа О 


и его значением становится степень свободы 2. Связи действий 09 и 19 
на дереве БЗ, которую обозначим а21, присвоим значение аз = 1, которое 
указывает, что действие 09 приводит именно к распознаванию образа О1. 

Спустя какое-то время может быть обнаружено, что аналогичным свой- 
ством обладают и некоторые другие действия. Пусть, например, это №2 и 1%, 
тогда они включаются в «значение» действия 09, и получаем 


Р? = (12,15, 1%). 


Это означает, что для того, чтобы вызвать распознавание образа О, управля- 
ющей системе надо выбрать случайным способом и инициировать одну из сте- 
пеней свободы і, и5 или из. «Значения» действий (т. е. число альтернативных 
способов получить один и тот же эффект от воздействия на среду) могут уве- 
личиваться впоследствии. Действительно, это соответствует свойствам нашей 
жизни — со временем мы находим и запоминаем все больше способов, как 
добиться одного и того же результата. 

Если мы рассматриваем один образ, притом — в условиях, когда он не 
распознан, то мы можем все действия разбить на три класса, в зависимости 
от того, как они влияют на этот образ: действия, вызывающие его распознал 
вание, действия, которые блокируют его распознавание, и действия, связь 
которых с данным образом нам не известна. На этом основано дихотоми- 
ческое отношение действий Р; и образов О; в нашем бинарном дереве БЗ. 
Именно, действия из первого класса помечаются показателем связи а: = 1, 
это действия, вызывающие распознавание образа О;. Действия из второго 
класса помечаются показателем связи а;; = —1, это действия, вызывающие 
блокировку распознавания образа О;. Действия из третьего класса просто 
никак не отмечаются в бинарном дереве. Например, пусть имеется три освети- 
тельных прибора, снабженных двумя кнопками «включить» и «выключить». 
Пусть имеется образ Оу «в помещении светло». Пусть распознано условие 
С() =|Оь, т.е. «в помещении не светло». Тогда распознавание образа О 
«в помещении светло» можно вызвать, нажав на любую из трех кнопок 
«включить». Три этих варианта (степени свободы) и составляют известное нам 
действие, вызывающее появление света. Но точно известно, что при отсутствии 
света нажатие на любую из кнопок «выключить» не приведет к появлению 
света. Это действие, блокирующее распознавание образа. Возможно, имеются 
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О. 5. С(® =|О! 
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Рис. 3.58. УС нашла несколько способов, как вызвать распознавание образа О 
и как заблокировать его распознавание 


и другие «степени свободы» и действия, но их связь со светом нами в этом 
примере не установлена, и потому они пока не включены в БЗ. 

Итак, пусть через некоторое время управляющая система нашла несколько 
степеней свободы, которые составили оба действия — Р? и Р? с некоторыми 
их «значениями». Поместим их в пример дерева БЗ (рис. 3.58). 

Хотя УС нашла несколько способов воздействия на прообраз образа О\, 
все они действительны только для случая, когда этот образ не распознан. 
Поэтому таких знаний недостаточно для полного управления прообразом этого 
образа. УС в данном случае знает, как вызвать распознавание образа и как 
сделать так, чтобы он не был вызван. Но как обращаться с этим прообразом, 
когда образ уже распознан, этого УС еще не знает. Поэтому надо подождать, 
пока при анализе эволюции управляющей системой не будут найдены дей- 
ствия для условия, когда образ О распознан, т. е. С(Ь = Оз. Здесь также 
налицо дихотомические отношения, симметричные первому случаю. Именно, 
если образ распознан, то все действия можно подразделить на три класса: 
действия, вытесняющие образ (прообраз исчезает из поля зрения и перестает 
распознаваться подсистемой ФРО); действия, блокирующие вытеснение образа 
(образ точно останется распознанным); и действия, влияние которых на образ 
не обнаружено. Действиям из первого класса присваиваем показатель связи 
аз; = —1, действиям из второго класса присваиваем показатель связи а; = 1, 
остальные действия не заносятся в БЗ. 

Пример такого дерева БЗ показан на рис. 3.59. 


вр 5 СЯ = О 
0 
Ог 60; "ї = (01,12,...,0,...,0№) 
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Р2 — 2 —, 
Рай > 27 > 

Е ее АА Я залар Т авара 7 
| 1 1 | | | | 
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Рис. 3.59. УС нашла несколько способов, как вызвать вытеснение образа О и как 
заблокировать его вытеснение 
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Если УС нашла такие знания по отношению к образу О как знания, пока- 
занные на рис. 3.58 и 3.59, то можно считать, что этой УС крупно повезло, ведь 
она теперь так умна, что располагает всем спектром возможностей влияния 
на прообраз этого образа. Например, если данный объект управления — это 
ребенок, а прообраз образа Оу — это игрушка, то данный ребенок с такой 
БЗ знает, как: получить игрушку, если ее не было, удержать игрушку, если 
она уже в руках, выбросить игрушку, если она в руках, не получить игрушку, 
если ее нет. Это полный набор действий, и для того, чтобы его найти, иногда, 
уходит много времени и сил. Например, если речь идет об образе некоторой 
болезни, то для поиска знаний о том, как вылечить болезнь, если она уже есть, 
как сделать так, чтобы избежать заболевания, как вызвать заболевание, если 
его нет — в медицине могут уходить многие годы, и далеко не всегда поиск 
увенчивается успехом. 

Вернемся к дереву БЗ. До сих пор мы рассматривали ситуацию, когда был 
сформирован лишь один образ. Но наступает момент, когда в УС сформиро- 
вывается и второй образ, который обозначим Оз. Поместим идентификатор 
этого образа и его эмоциональную оценку на 2-й уровень дерева БЗ. Зная 
об этом образе, УС должна найти способы воздействия и на его прообраз. 
Для нас сейчас неважно, какой тактикой будет пользоваться УС для поиска, 
действий, которыми можно воздействовать на образ Оз. Например, УС может 
инициировать только те степени свободы, которыми она воздействует на про- 
образ образа О, выбирая их случайно из соответствующих действий. Может 
выбирать степени свободы и из корневого действия, реализуя тактику поиска 
новых знаний. Но если рано или поздно будут обнаружены степени свободы, 
которые закономерно воздействуют на образ О, то в дерево БЗ следует внести 
новые записи. Это можно сделать следующим способом. Дополним имеющийся 
слой БЗ новым условием, если в соответствии с новыми найденными знаниями 
оно не вносит противоречий, либо создадим новый слой, если противоречит. 
Новое действие располагаем на том уровне дерева, где лежит новый образ. 
При этом новое действие пусть будет сыном того действия, подмножеством 
которого оно является. Будет оно левым сыном или правым, зависит от того, 
вызывает оно образ или вытесняет его. Пример приведен на рис. 3.60. 

Смысл деления действия-отца на два действия-сына состоит в том, что 
действия-сыновья учитывают влияние на большее (на один) число образов, 


О, 8, с 10.40, 
Оз ба Рі = (01,0, т; ‚„ом) 
Ба 1 а3,1 Вее ое 
Оі 61 2 == (02,05,08, 09) 1 — (04, 15) 
ШЕ | 
Оз 652 14 = (0,0,0) 08 = (12) р0 = (ва) 


Рис. 3.60. Развитие дерева Базы Знаний 


212 Глава 3. Синтез моделей нервных систем 


чем действие-отец. Например, на рис. 3.60 действия 0%, 09 и 08 учитывают 
влияние не только на образ О, но, дополнительно, еще и на образ О». Именно, 
действие 0% выделено в отдельное действие потому, что выбор степени свободы 
и5 или из вызывает одновременно распознавание и образа О, и образа О», 
которые ранее были не распознаны, согласно условию. Результат совершения 
действия 09 иной — распознавание образа О тоже будет вызвано, но при 
этом будет блокировано распознавание образа О». В свою очередь, действие 08 
приводит к распознаванию образа О, но блокирует распознавание образа О}. 

Подчеркнем, что речь идет не о последовательном воздействии на образы, 
а об одновременном воздействии (один образ вызываем, а другой одновременно 
вытесняем). 

Удобны следующие правила нумерации образов. Если Пг есть действие- 
отец, то его левый сын (с показателем связи 1) снабжается номером Рэ, 
а правый сын (с показателем связи —1) — номером 25, у. При этом «зна- 
чения» действий-сыновей и действия-отца должны подчиняться следующим 
отношениям: 


То, 
жП 5р = 8, 
2% У. 5р С Рі. 


Смысл этих отношений состоит в том, что «значение» записанного в БЗ 
действия не должно быть пустым, действия-сыновья должны иметь различные 
«значения», иначе получится, что одна и та же степень свободы оказывает 
разные воздействия на образ (здесь мы не учитываем вероятностных зави- 
симостей, а точнее — они огрублены до принятых решающих правил). Кроме 
того, «значения» действий-сыновей должны представлять собой подмножества 
«значения» действия-отца. 

Если для нового действия не находится действия-отца на предыдущем 
уровне дерева, то это действие становится корневым действием нового под- 
дерева, которое помечается очередным индексом т, и получает номер 05, если 
оно имеет показатель связи 1, или 05, если оно имеет показатель связи —1. 
При последующем развитии этого поддерева его корневое действие может 
найти своего отца, если соответствующим способом изменятся «значения» 
этих действий. В этом случае поддерево, нашедшее связь с вышестоящим 
деревом, перенумеровывается. Понятно, что возможны и другие формальные 
преобразования поддеревьев, например их разделение, если часть поддерева 
связывается с вышестоящим деревом, тогда оставшаяся часть выделяется в от- 
дельное несвязанное поддерево. Пример БЗ, имеющей несвязанное поддерево 
с корнем 02 = (1с), показан на рис. 3.61. В этом состоянии неясно, с левым 
или с правым сыном будет связано действие со «значением» (и), поэтому оно 
выделено в отдельное поддерево. 

Наиболее сложная проблема, возникающая при построении БЗ в виде 
бинарного дерева, состоит в учете условий, которые определяют применимость 
дерева знаний. Если полагать, что образы условия и образы результатов — 
это одни и те же образы, то формирование каждого нового образа порождает 
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Рис. 3.61. Пример бинарного дерева БЗ с несвязанным поддеревом 


новые варианты условий, и если для каждого условия формировать свое 
дерево, то получается комбинаторный взрыв. Для решения этой проблемы 
возможны следующие пути. 


(а) Пусть имеется самый общий случай, когда образы, входящие в условие, 
и образы результатов — это одни и те же образы. И пусть мы имеем самый 
тяжелый случай, когда для каждой логической комбинации образов условия 
свойства среды меняются и надо находить новую Базу Знаний. Тогда заметим, 
что 0-й уровень дерева содержит корневое действие, которое не ориентируется 
ни на какой образ результата, и потому оно истинно и единственное. Действия, 
которые лежат на 1-м уровне и учитывают влияние только на 1-й из сформи- 
рованных образов, зависят от текущего состояния 1-го образа (распознан или 
не распознан). Поэтому условие, связанное с 1-м образом, относится только ко 
всем лежащим ниже уровням дерева, содержащим действия-потомки, наследу- 
ющие свойства этого действия 1-го уровня. Соответственно, можно расщепить 
дерево БЗ на уровне корня на два слоя, в одном из которых будет лежать 
дерево, соответствующее случаю, когда 1-й образ распознан, а во втором будет 
лежать дерево, соответствующее случаю, когда 1-й образ не был распознан- 
ным. При появлении в БЗ 2-го образа, каждый из двух слоев дерева БЗ опять 
может быть расщеплен на два слоя теперь уже на 1-м уровне. и т. д. Получа- 
ется трехмерное бинарное дерево (рис. 3.62), расщепляемое не только вширь, 
в зависимости от влияния действий на образы результатов, но и вглубь — 
в зависимости от состояния образов условий. При этом каждый слой такого 
расщепленного дерева БЗ работает при выполнении своего условия, наследуе- 
мого всеми потомками. 


(6) Как уже говорилось, в большинстве случаев результат действия описы- 
вается иными образами, чем исходные состояния. И таких образов результатов 
действий гораздо меньше, чем образов исходных состояний. Чтобы понять, 
о чем идет речь, достаточно обратиться к своему опыту и вдуматься в то, как 
именно вы представляете себе результат совершения любого своего элементар- 
ного действия. 
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Рис. 3.62. Трехмерное бинарное дерево БЗ, отражающее 
совокупность условий применимости 


Например, что именно вы планируете увидеть, если собираетесь задрать 
голову вверх и посмотреть в небо? Скорее всего, вы планируете увидеть просто 
образ облачного неба, если день облачный, но вряд ли вы планируете увидеть 
некоторые конкретные формы облаков. Что именно вы ожидаете увидеть 
перед тем, как опустите голову вниз и посмотрите на землю? Скорее всего — 
некоторый обобщенный образ земли, а не конкретные травинки и камешки. По- 
этому можно полагать, что образов результатов на самом деле совсем немного, 
тем самым и уровней в дереве будет не слишком много. В подтверждение этого 
тезиса можно привести примеры систем управления, построенных, например, 
на принципах обучения с подкреплением (теіпіогсешепё Іеагпіпе), где основа- 
нием для принятия решения служит отнюдь не множество образов, которые 
предполагается распознать в результате совершения действия, а всего лишь 
некая усредненная эмоциональная оценка, результата. Этого уже оказывается 
достаточным для управления во многих случаях. 

Здесь мы рассмотрели, как можно строить БЗ в виде бинарного дерева, 
и как представлять в ней знания, получаемые в результате эмпирического 
взаимодействия объекта управления со средой. Подчеркнем, что мы здесь 
еще не рассматривали собственно стратегию принятия решений, направленную 
на добывание знаний, а говорили только о том, как представлять добытые 
знания в БЗ. В данном разрезе нам все равно, как, собственно, принимались 
решения, нам было важно лишь то, что в результате взаимодействия со средой 
были найдены определенные закономерности. 

Теперь перейдем к рассмотрению способа принятия решений с помощью БЗ 
описанного вида. 


Принятие решений с помощью Базы Знаний, представленной в виде 
бинарного дерева. База Знаний предназначена для представления и со- 
хранения в памяти знаний о функциональных свойствах среды и необхо- 
дима для принятия решений. Как уже отмечалось, решения принимаются 
с двумя целями: обеспечить выживание объекта управления и накапливать 
новые знания, которые в свою очередь будут способствовать выживанию (или 
наоборот — выживать, чтобы накапливать новые знания). Чтобы не нагружать 
управляющую систему лишней интеллектуальной задачей — необходимостью 
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каждый раз выбирать, к какой цели следует стремиться — к выживанию или 
к накоплению новых знаний, природа замаскировала эту проблему, заменив 
обе эти целевые функции одной целью. Эта универсальная цель состоит 
в постоянном стремлении управляющей системы к повышению общей эмоцио- 
нальной оценки состояния. Эта цель достигается только через распознавание 
образов с возможно более высокими положительными оценками и вытеснение 
образов с отрицательными оценками. И то и другое, а также сам механизм 
принятия и реализации решений и должны одновременно способствовать 
выживанию объекта управления и накоплению новых знаний. Опишем, как 
это можно реализовать, если использовать БЗ в форме описанного выше 
бинарного дерева. 

Пусть к текущему моменту подсистемой ФРО было сформировано 3 образа: 
От, Оз и Оз, а подсистема эмоций определила для этих образов эмоциональные 
оценки 51, 52 и 5з. Положим для примера, что эти оценки имеют следующие 
значения 51 = «—3», 55 = «2» и 53 = <—4». И пусть в текущий момент # 
подсистема ФРО распознала образ Оз. Управляющей системе следует принять 
решение, какое действие следует совершить в следующий момент времени #&-+1. 
Управляющая система обращается к своей БЗ (рис. 3.62) и смотрит, какой 
из ее слоев адекватен текущей ситуации, т.е. содержит знания, которые можно 
применить в текущей ситуации. Пусть в БЗ найдется такой слой, который 
изображен на рис. 3.61. Этот слой знаний применим в текущей ситуации, так 
как условие применимости выполняется: 


С = 0:&05&03 = ВАЛ = 1. 


Управляющая система, отделив пригодный слой БЗ, начинает рассчитывалъ, 
какое действие, в случае его выполнения, принесет наибольшую прибавку 
общей эмоциональной оценке. Для выбора лучше всего использовать «листья» 
дерева — действия, не имеющие «сыновей» и наиболее удаленные от корня 
дерева, так как именно они учитывают наибольшее число последствий — 
наибольшее число образов результатов. Это наиболее умные, дальновидные 
действия. В дереве, представленном на рис. 3.61, имеется 5 листьев: 03, 09, 
29, 03 и Гі. Посчитаем, какие приращения эмоциональных оценок А5 могут 
дать эти действия, учитывая эмоциональные оценки образов и вид влияния 
действия на образы, отраженный показателями связи. Напомним, что 


а) если образ не распознан и мы его вызываем (показатель связи равен 1), 
то получаем приращение оценки, соответствующее знаку его эмоцио- 
нальной оценки, 

б) если образ был распознан и мы его вытесняем (—1), то получаем убыль 
оценки в соответствии с ее знаком, 

в) если образ не был распознан и мы его блокируем (—1), то приращения 
оценки не получаем, 

г) если образ был распознан и мы его блокируем (1), то приращения оценки 
также не получим. 
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Итак: 
А8(р0) =0+1. «2» +1. «-— 3» = « – 1», 
А8(00) =-1.‹-— 4» +1. «2» +1. < – 3» = «3», 
А8(00) = –-1.«- 4» - 0+1. < – 3» = «1», 
А8(р0) = –0 = «0», 
А8(р1) = 0-0 = «0». 


Отсюда следует, что в данном случае следует выбрать действие 09, так как 
оно обещает дать наибольшее приращение эмоциональной оценки. Действи- 
тельно, это действие обещает вытеснить распознанный образ Оз с большой 
отрицательной оценкой «—4», одновременно вызвать распознавание образа О 
с большой положительной оценкой, хотя при этом и вызывает образ О! 
с отрицательной оценкой «—3». В совокупности этот результат лучше, чем 
все другие известные УС варианты. Выбирая действие, которое обещает дать 
наибольшее приращение эмоциональной оценке, УС тем самым способствует 
выживанию объекта управления (при условии, что «приятные» образы од- 
новременно и полезны объекту управления, о чем должен был позаботиться 
естественный отбор). 

Обратим внимание, что описанная процедура принятия решения одновре- 
менно содержит в себе и компонент, направленный на достижение другой 
цели — накопление новых знаний. Действительно, в результате детермини- 
рованного выбора действия, направленного на обеспечение выживания, УС 
выбрала некоторое действие, в данном случае БЕА Однако под этим идентифи- 
катором скрывается определенное множество «степеней свободы» — вариантов 
воздействий на среду, которые с точки зрения имеющихся у УС на текущий 
момент знаний равнозначны, приводят к одинаковым последствиям. В данном 
случае это множество (№5, №9). Выбор конкретной степени свободы из этого 
множества должен производиться уже случайным способом. Вот этот элемент 
случайности и обеспечивает поиск и накопление новых знаний. Никто пока, 
не знает, как та или иная степень свободы из выбранного множества влияет 
на образы, которые еще не сформированы. В случае рассматриваемого при- 
мера (рис. 3.61), мы не знаем заранее, как степени свободы №5 и №9 влияют 
на еще не сформированный образ О4, возможно, что они не влияют совсем, 
либо влияют по-разному, либо влияет только один из них и т. д. Выбирая эти 
степени свободы случайным способом, УС постепенно найдет ответы на эти 
вопросы, т. е. расширит свои знания. Далее это будет распространяться на все 
сформированные впоследствии образы. 


Время принятия решения. В гл.2 говорилось о том, что существует 
необходимость и возможность обоснованно ограничивать время, отведенное 
на принятие решений. Такое время, как было сказано, может определяться 
функцией 

а45(® 


0) = (500), 20), 
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в которой в зависимости от текущего значения общей эмоциональной оценки 
5'(Р) и ее производной 45(#) / определяется число образов результатов дей- 
ствия, которые можно успеть проанализировать для принятия решения. 

Поскольку число образов результатов тем самым ограничивается, то ра- 
зумно при принятии решений анализировать только образы с самыми боль- 
шими по модулю эмоциональными оценками. Действительно, нас должно 
интересовать в первую очередь самое главное — возможность уйти от самых 
больших неприятностей или возможность получить самый большой выигрыш 
из возможных в текущий момент. Поэтому при расчете приращений эмоцио- 
нальных оценок для альтернативных действий следует упорядочить слагаемые 
в порядке убывания модуля эмоциональных оценок образов результатов. Затем 
следует рассчитать сумму только первых (Ё) слагаемых. 

Пусть для рассмотренного примера К({) = 2. Тогда после упорядочивания 
слагаемых получаем, что приоритет образов результатов убывает в следующем 
порядке — Оз (53 = —4), О; (51: = -3), Оз (5 = 2). Поскольку в текущий 
момент времени управляющей системе некогда прогнозировать результат по 
более чем двум образам, то образ Оз с эмоциональной оценкой 52 = 2 
отбрасывается как второстепенный и для принятия решения рассчитываются 
только следующие суммы: 


45(08) =0+1. < – 3» = « – 3», 
А8(р0) = -1.«- 4» +1: «- 3» = «1», 
А8(0%) =-1.«- 4» +1. «- 3» = «1», 
Д5(03) = —0 = «0», 

А8(р1) =0-0= «0». 


Из расчета следует, что в текущий момент УС может выбрать одно из двух 
действий: 09 либо 0%. , так как они приведут хотя и к содержательно разным 
результатам, но дающим одинаковую максимально возможную в текущий 
момент прибавку общей эмоциональной оценки. Для принятия конкретного 
решения управляющей системе остается произвести вначале выбор из множе- 
ства найденных альтернативных действий — 100 либо ГАР а затем произвести 
выбор конкретной степени свободы из «значения» выбранного действия. И тот, 
и другой выбор можно произвести случайным способом за неимением лучшего 
способа. Например, пусть было выбрано действие 0%, и степень свободы 1. 

Мы видим, что в условиях дефицита времени управляющая система при- 
няла не самое оптимальное, но все же достаточно разумное действие, которое 
должно привести объект управления в одно из лучших состояний, которые воз- 
можны в текущем положении. В данном случае управляющая система, не имея 
времени для более тщательного планирования, проигнорировала реальную 
возможность правильно повлиять на образ О, вызвать его распознавание, что 
принесло бы управляющей системе еще большую прибавку в эмоциональной 
оценке. Но таковы были текущие условия, что УС не успела осознанно принять 
действительно оптимальное решение. Кстати сказать, у УС после сделанного 
ею детерминированного выбора еще оставался шанс выбрать оптимальное 
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действие [9 в тот момент, когда она в спешке уже случайно выбирала между 
3 и р, но так уж «легла карта», что выбор пал в пользу 0%. 

В рассматриваемых системах никогда нельзя сказать, что какое-то из вы- 
бранных действий является оптимальным в истинном смысле. Решение всегда, 
оптимально только в условиях той информации, которой располагает управ- 
ляющая система. Поскольку нельзя сказать «более оптимальное решение» 
или «менее оптимальное решение», то будем использовать прилагательные 
«лучше» и «хуже», которые будут означать, что решение ближе к оптималь- 
ному или дальше от оптимального, соответственно. 

Рассмотренный способ принятия решений реализует процедуру, в кото- 
рой одновременно заключен и поиск, и принятие решений, что обеспечивает 
обучение в процессе управления. Очевидно, что можно предложить и другие 
способы принятия решений, по-иному организующие процедуру поиска. Эти 
способы могут опираться на эвристики, на информацию, заключенную в струк- 
туре самого дерева БЗ, на содержание информации БЗ, а также, естественно, 
на любую априорную информацию о свойствах конкретного прикладного 
объекта управления и среды, для которой строится управляющая система. 
Можно предложить, например, следующие подходы. 


Сравнение эмоциональных оценок текущего и результирующего со- 
стояния. Обратим внимание на следующую особенность. В процедуре при- 
нятия решений оценка эмоционального состояния текущего момента исполь- 
зовалась нами только для того, чтобы рассчитать время, которое можно 
потратить на принятие решения. Однако мы совсем не учитывали, будет 
ли эмоциональная оценка результата выше или ниже эмоциональной оценки 
текущего состояния. В первом приближении это верно. Действительно, мы 
должны стараться перейти в состояние, лучшее из всех возможных для следу- 
ющего момента состояний, и делать это независимо от того, какой оценкой 
характеризовалось текущее состояние. Если это результирующее состояние 
окажется лучше предыдущего, мы можем порадоваться, а если хуже, то можно 
об этом сожалеть. Материальным выражением этих эмоций станет величина, 
приращения эмоциональной оценки (5 (1) /&, которая в свою очередь повлияет 
в следующие моменты на время принятия решений. Но сравнение эмоциональ- 
ных оценок текущего и результирующего состояний при более тщательном 
моделировании процессов принятия решений все-таки должно учитываться. 
Вот несколько возможных зависимостей: 


— если ожидаемая эмоциональная оценка следующего состояния низка, 
то в некоторых случаях целесообразно отказаться от перехода в такое 
состояние и рискнуть совершить неизвестное действие в надежде на слу- 
чайный переход в состояние с более высокой оценкой; 

— поскольку эмоциональная оценка текущего состояния влияет на время, 
которое можно потратить на принятие решений, то при многошаговом 
принятии решений ожидаемая плохая оценка следующего состояния 
может влиять на время, которое планируется отвести на принятие или 
коррекцию решения на слелующем шаге. 
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Энтропийные характеристики знаний, представленных в бинар- 
ном дереве. Обратим внимание, что используемые для принятия решений 
действия- «листья» бинарного дерева могут лежать на разных уровнях бинар- 
ного дерева БЗ. О чем это говорит? Во-первых, о том, что такие действия 
учитывают влияние на разное число образов. Эту характеристику действий 
можно использовать в процедуре принятия решений. Например, пусть найдено 
два альтернативных действия, которые обещают дать одинаковое прираще- 
ние эмоциональной оценки. Но одно из этих действий добивается результата 
с помощью одного образа, но с большой (по модулю) эмоциональной оценкой, 
а другое действие — с помощью нескольких образов с более низкими (по 
модулю) оценками. Возможно, что в некоторых случаях, при прочих равных 
условиях, можно учитывать и эту характеристику, хотя мы сейчас и не можем 
сразу указать такие условия. Предлагаем представить себе подобную ситуа- 
цию из своего опыта — вам предлагается получить выигрыш, сделав ставку 
на один объект, либо такой же выигрыш от ставок, сделанных на много разных 
объектов. На подобный выбор может повлиять, например, учет вероятностей 
отклика образов на действия и склонность к риску самой подсистемы принятия 
решений. 

Однако нам представляется гораздо более определенной зависимость вы- 
бора, действия при прочих равных условиях от степени неопределенности дей- 
ствий, которую можно выразить такой характеристикой, как энтропия. Напом- 
ним, что энтропия информации является мерой неопределенности ситуации 
и выражается следующим способом. Пусть мы знаем, что некоторый объект 
находится в одном из № возможных состояний, пронумерованных величиной 
к= 1,2,..., №, и вероятность реализации каждого из этих состояний равна (к. 
Тогда наши знания относительно того, в каком состоянии находится объект, 
можно характеризовать так называемой «энтропией» Н, величина которой 
вычисляется по формуле 


Чем больше неопределенность ситуации, тем больше энтропия. 

Идея энтропийной характеристики действий в бинарном дереве БЗ состоит 
в следующем. Пусть УС сформировала, например, Р = 4 образа результата. 
Следовательно, в дереве имеется 4 уровня. Пусть имеется действие-«лист» Оу, 
лежащее на уровне п = 2, т.е. УС знает, как это действие влияет на образы 
От и Оз, но не знает, как оно влияет на образы Оз и Од. Если мы будем 
рассматривать только один слой дерева БЗ, то можем сказать, что существует 
4 варианта способов влияния этого действия на эти два образа. Тем самым, 
нам неизвестно, какой из 4 вариантов этого действия может определиться 
в будущем. Если для нас все варианты равновероятны, то формула для 


вычисления энтропии приобретает следующий вид: 


Н=Р-п+1. 
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Назовем эту характеристику 1-г0 рода потенциальной энтропией дей- 
ствия. 

По этой формуле энтропия рассматриваемого действия равна 3. Если же 
рассматривается другое действие-«лист», лежащее в этом дереве на уровне 
п, = 3, то его энтропия будет равна 2. Мы видим, что энтропия второго дей- 
ствия меньше. Это означает, что у этого действия меньше неопределенность, 
от этого действия следует ждать меньше неожиданностей в будущем, и тем 
самым — когда это действие полностью определится, оно принесет меньше 
новой информации, чем первое действие, у которого энтропия выше. Как 
можно использовать эту энтропийную характеристику действия? Например, 
если в процессе принятия решения УС выявила два равноценных альтерна- 
тивных действия, то предпочтение следует отдать действию с большей энтро- 
пией, если акцент при принятии решения сделан на цели «накопление новых 
знаний», потому что такое действие может принести больше неожиданностей, 
т.е. больше новых знаний. Если же акцент делается на цели «выживание», то 
предпочтение следует отдать действию с меньшей энтропией. Так, например, 
в жизни мы иногда выбираем новую дорогу к старой цели, если надеемся 
на поиск новых впечатлений, но выбираем старую хорошо знакомую дорогу, 
если хотим избежать новых впечатлений. 

Можно рассчитать суммарную энтропию 1-го рода для всей БЗ. Обратим 
внимание на важную особенность поведения этого рода энтропии во времени 
(рис. 3.63). По мере того как УС находит способы работы (новые действия) 
с новым для нее образом, суммарная энтропия постепенно уменьшается. Это 
говорит об уменьшении неопределенности знаний УС, т.е. УС постепенно 
«умнеет». Однако каждый раз, когда формируется новый образ (число Р 
увеличивается), суммарная 1-го рода энтропия БЗ резко возрастает, т. е. сум- 
марная неопределенность БЗ скачком увеличивается. В целом это приводит 
к «пилообразному» возрастанию суммарной энтропии БЗ со временем, которое 
постепенно замедляется при исчерпании возможностей для формирования 
новых образов. Если УС для измерения своего «ума» полагается именно на эту 
характеристику, то она может утверждать, что чем больше она «знает» (обра- 
зов), тем больше она «не знает» — тем выше энтропия — неопределенность ее 
знаний. Вспомним высказывание Анаксимена, с которого мы начали книгу: 
«Чем шире круг твоих знаний, тем больше его граница с неизвестностью. 
И чем больше ты станешь узнавать нового, тем больше будет возникать 
у тебя неясных вопросов». Тем самым, график на рис. 3.63 является точным 
количественным подтверждением высказывания Анаксимена. 

Чтобы этого не происходило, можно при расчете энтропии опираться не на 
число Р уже сформированных образов, но на число М, равное числу обра- 
зов, которые вообще может сформировать имеющаяся подсистема ФРО, если 
таковое число известно. Такая энтропийная характеристика в случае равных 
вероятностей может быть рассчитана по формуле 


Н= М-п+1. 


Назовем эту характеристику 2-го рода потенциальной энтропией дей- 
ствия. 
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Рис. 3.63. Экспериментальное подтверждение мудрости «чем больше я знаю, тем 

больше я не знаю». Значение 1-го рода энтропии Базы Знаний постепенно уменьша- 

ется по мере того, как УС находит способы работать с новым образом, но сильно 

повышается скачком при формировании нового образа (экспериментальный график, 
полученный Л. В. Земских) 


Пусть известно, что подсистемой ФРО могут быть сформированы М об- 
разов, но интересующее нас действие контролирует пока только Р образов. 
Тогда при необходимости можно оценить, какой минимальной энтропии смогут 
достичь потомки этого действия, если не будет сформировано нового образа 
и в случае равновероятных вариантов. Назовем эту характеристику 5-го рода 
потенциальной энтропией действия: 


Н= М-Р 


На основе таких энтропийных характеристик можно предложить харак- 
теристики, отражающие общую неопределенность БЗ. Такие характеристики 
представлены в работе [24], здесь их приводить не будем, чтобы не перегружать 
работу формулами. 

Еще обратим внимание на то, что каждое действие, в «значении» которого 
имеется более чем одна степень свободы, выбирать из которых управляющей 
системе предстоит случайным способом, тем самым тоже имеет свою неопре- 
деленность. Если число степеней свободы действия равно л, а все вероятности 
их выбора равны, то можно использовать такую характеристику, как явную 
энтропию действия 

Н = 105, п. 
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Такую характеристику действий также можно использовать в процессе 
принятия решений, когда приходится выбирать из равноценных альтернатив- 
ных действий. 

Итак, мы рассмотрели некоторые возможности процедуры принятия реше- 
ний, в которых мы не учитывали пока никакой другой информации, кроме 
той, которая содержится в самом дереве. 

Следующий класс вспомогательных процедур, которые можно использо- 
вать при принятии решений, связан с закономерностями, которые можно 
обнаруживать в содержании уже накопленных в БЗ знаний. Такие закономер- 
ности, если они обнаруживаются, могли бы составлять прогноз относительно 
еще не выявленных знаний, что могло бы направлять процедуру случайного 
поиска в определенное русло. Такого рода операции мы рассмотрели выше, 
когда обсуждали табличный способ представления Базы Знаний. Хотя мы 
и понимаем, что какие-то аналогичные процедуры можно предложить и для 
Базы Знаний, представленной в виде бинарного дерева, но пока не можем 
предложить таких процедур и оставляем их поиск нашим читателям. 


3.3.6. Общий взгляд на проблему БЗ, 
многоуровневое управление и принятие решений 


Если мы можем описать состояние некоторого объекта множеством текущих 
значений его параметров, то эволюция этого объекта во времени представляет 
собой набор кривых, описывающих временной ход этих параметров, начинаю- 
щихся в некоторый момент времени в прошлом и заканчивающихся в текущий 
момент времени. Можно также описать состояние объекта точкой в много- 
мерном признаковом пространстве-времени, тогда эволюция объекта будет 
представлена некоторой траекторией 2(1) в этом пространстве, по которой 
двигалась точка от первого момента времени до текущего момента времени. 
Если параметр всего один, то оба этих представления эволюции совпадают. 
Если мы хотим говорить не просто об объекте, но об объекте управляемом, 
и хотим говорить о его эволюции не как об уже свершившемся в прошлом 
процессе, но рассматривать эту эволюцию как результат процесса управления, 
который не закончился, а продолжается и в текущий момент, то временные 
рамки этой картинки надо расширить и продолжить их от текущего момента 
времени в будущее. Управление всегда предполагает наличие цели, которая 
опережает текущий момент времени, следовательно, уходит в будушее. У си- 
стемы управления есть некоторое представление о будущей эволюции данного 
объекта. Эта эволюция в случае управляемого объекта есть не просто пас- 
сивное предсказание неизбежной неуправляемой эволюции, как предсказание 
траектории падения летящего камня, но это есть представление о желаемой 
траектории, например желаемой траектории полета ракеты, для свершения 
которой управляющей системе еще придется прикладывать управляющие 
воздействия. Следовательно, представляя эволюцию управляемого объекта, 
надо изобразить еще временной ход управляющих воздействий (1), которыми 
система управления направляет объект по желаемой ею траектории. А если 
мы говорим о наличии «желаемой» траектории, которой добивается система 
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Рис. 3.64. Эволюция управляемого объекта может быть представлена временной 

траекторией 5({) в многомерном пространстве параметров, временным рядом управ- 

ляющих воздействий у(#) и временным рядом оценочной качественной характери- 
стики 2(#) 


управления, то это означает, что эта траектория чем-то выделяется из множе- 
ства всех других возможных траекторий, она для данной системы управления 
чем-то «лучше» других траекторий. Значит, у данной системы управления 
есть некоторая система критериев для качественной оценки состояний и тра- 
екторий в эволюции объекта управления. Очевидно, что не в каждый момент 
времени состояние объекта управления «наилучшее» по данному критерию. 
Система управления противодействует окружающей среде, и иногда ей удается 
выдержать желаемую траекторию эволюции, и тогда качественные оценки 
выше, а иногда не удается, и тогда качественные оценки ниже. Образуется еще 
одна временная кривая — эволюция качественных оценок 2({). Умная система 
управления планирует определенную эволюцию качественных оценок и в бу- 
дущее, согласуя их со своими планируемыми управляющими воздействиями 
и их результатами. Поэтому такой вид эволюции объекта, как управление, 
следует изображать как минимум тремя эволюционными кривыми 2(#), у(#) 
и 2(0) (рис. 3.64). 

Если мы имеем дело с адаптивной управляющей системой (УС) в наиболее 
общем ее виде, то задачи адаптивной УС состоят в следующем: 


1) наблюдая за траекториями параметров 2(#), у(Ё) и 2(#), выявить в них 
закономерности и зафиксировать их в своей памяти, 

2) распознать в текущий момент те закономерности, которые действуют 
в текущий момент, 

3) спланировать на будущее такие значения управляющего параметра у(®, 
которые приведут к максимизации ряда 2(#), 

4) инициировать управляющие воздействия согласно принятым решениям, 

5) корректировать знания по результатам анализа новой информации. 
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Информация о временных рядах данных, относящихся к прошлому, хра- 
нится в памяти УС в сжатом виде. При этом коэффициент сжатия данных по 
времени тем больше, чем к более далекому периоду в прошлом относятся эти 
данные. С другой стороны, точность представления сжатых данных тем хуже, 
чем старее данные. Поскольку всякие сжатые данные называются «знаниями», 
то можно говорить, что УС располагает некоторыми знаниями относительно 
прошлого данного процесса, управления. 

Таким образом, в каждый текущий момент УС может анализировать 
данные о прошлом, располагая только своими «знаниями» о прошлом, как 
бы глядя на прошлое с помощью «мегадатчика», имеющего определенные 
пространственно-временные окна. 

Выявление закономерностей состоит в следующем. Во-первых, временной 
ход указанных рядов наблюдается УС с помощью системы распознавания 
(СР). Во-вторых, СР наблюдает не только непосредственную текущую ин- 
формацию, поступающую с датчиков, следящих за средой, но с помощью 
«мега-датчика» наблюдает и за содержимым памяти, в которой записаны 
агрегированные и сжатые определенным способом данные об уже ушедших 
в прошлое наблюдениях. Эти данные, сохраненные в памяти, и есть «знал 
ния» УС, потому что они отражают некоторые закономерности. В-третьих, 
сравнивая текущую информацию со знаниями, СР распознает то, что она 
может распознать в текущей ситуации (множество образов). И наконец, в- 
четвертых, распознаваемые образы корректируют старые «знания», образуя 
новые «знания» о новых найденных закономерностях, которые и записываются 
в память. Не всякие данные с входных датчиков могут попасть в память. 
Во-первых, попадают данные, которые подпадают под правила, определяе- 
мые уже накопленными знаниями, т. е. содержимое памяти в большой мере 
определяет возможность попадания в память новой информации. Так, если 
мы знаем о творчестве некоторого писателя, то, скользя глазами по полкам 
книжного магазина и наткнувшись взглядом на книгу данного автора, мы 
как-то с ней взаимодействуем, в крайнем случае запоминаем, что в этом мага- 
зине продается новая книга, знакомого нам автора. Старые знания пропустят 
в память порцию новой информации. Если же имя автора нам не известно, мы 
можем не обратить на книгу ни малейшего внимания. Во-вторых, пропуском 
в память для новой информации может быть выполнение рассмотренных выше 
структурных и статистических критериев. Например, если размер заголовка 
и шрифт позволяют нам увидеть название новой книги на полке магазина, 
и при этом она попадается нам на глаза, уже в 20-й раз, то мы, в конце концов, 
обратим на нее внимание. И в-третьих, пропуском для новой информации 
в память может быть совпавший с нею по времени сильный всплеск эмоций, 
не важно — положительных или отрицательных. Так, книга с ничего не го- 
ворящими для нас названием и именем автора может привлечь к себе наше 
внимание, например, сильно тронувшей нас картинкой на обложке либо тем, 
что просто упадет с полки нам на голову. 

От емкости памяти и от глубины, на которую распространяются в па- 
мять поля зрения мегадатчиков системы распознавания, зависит способность 
управляющей системы извлечь из эволюции знания о ее закономерностях 
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большей или меньшей длины. Извлеченные нервной системой и используемые 
ею для управления закономерности могут описывать закономерности длиной 
несколько секунд, минут, часов, дней, недель, месяцев, лет, десятилетий. Спе- 
циально вербализованные знания в виде книг, изображений, зафиксированных 
научных наблюдений дают возможность извлечь знания, описывающие еще 
большие интервалы времени. 

От характерного времени закономерностей, которые способна извлечь 
из прошлого управляющая система, зависит способность прогнозирования 
и предсказания будущей эволюции. Если предсказываемая эволюция неуправ- 
ляема (например, явления природы), то УС может минимизировать свои 
потери, вовремя предприняв какие-то шаги к спасению. Если предсказываемая 
эволюция управляется данной УС, то она может выбрать лучший вариант 
из нескольких вариантов и, управляя эволюцией, добиться лучшего для себя 
результата. Если «знания» описывают краткосрочные закономерности, то 
и прогноз может быть только краткосрочным. Если «знания» описывают 
протяженные во времени закономерности, то и прогнозировать УС сможет 
так же далеко в будущее. 

Поскольку виртуальные поля зрения мегадатчиков, смотрящих в память, 
дают тем более размытую картину, чем глубже в прошлое они смотрят (а это 
неизбежно, так как информацию о прошлом приходится в памяти свора- 
чивать), тем меньше точность прогнозируемых явлений, уходящих на соот- 
ветствующее расстояние в будущее. Можно сказать, что управляющая си- 
стема смотрит на временной процесс эволюции таким мегадатчиком, в центре 
четкого видения которого находится настоящий момент времени, а по мере 
удаления в прошлое или в будущее острота зрения снижается. На рис. 3.64 
мы отобразили эту мысль с помощью расходящихся из центра в прошлое и в 
будущее двух «конусов» доверительных интервалов. 

Очевидно, что по мере развития способностей биологических управляющих 
систем к выработке закономерностей (которые можно назвать и моделями 
управления) большой протяженности происходила и специализация различ- 
ных отделов нервной системы в отношении работы с такими моделями раз- 
личного характерного времени. Проявлением такой специализации, на наш 
взгляд, является цефализация — увеличение относительной доли головного 
мозга, в составе нервной системы. Возможно, что основной задачей головного 
мозга и является выработка длинновременных и сложных закономерностей, 
их распознавание и применение при принятии решений. 

Очевидно также, что одновременно могут распознаваться и применяться 
несколько моделей управления различной длительности. Отсюда возникает 
ситуация с многоуровневым управлением. Модели управления могут иметь 
и разную важность с точки зрения управляющей системы, поэтому возникает 
задача иерархического управления. Рассмотрим эти задачи в общем виде. 

Для простоты вначале будем представлять дело так, будто бы за каждый 
уровень управления отвечает отдельная система управления, хотя на самом 
деле это не обязательно. 

По нашему мнению, многоуровневость управления определяется сравни- 
тельным отношением характерного времени тех закономерностей, которые 
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отрабатываются совместно работающими системами управления. Типичным 
примером многоуровневой системы управления является, например, экипаж 
самолета. На самом «низком» уровне управления находится пилот, который 
работает с краткосрочными закономерными процессами — он производит пи- 
лотирование самолета по заданному маршруту, что осуществляется с помощью 
управления рулями и другими механизмами самолета с целью осуществления 
взлета, обеспечения безаварийного полета, совершения необходимых манев- 
ров для выхода из опасных ситуаций, посадки и т. д. В качестве датчиков 
пилот использует авиационные приборы самолета, карту, пользуется своими 
органами чувств и опытом. В качестве актуаторов пилот использует органы 
управления самолетом, свои руки, ноги, голосовой аппарат. Период актуально- 
сти решений, принимаемых пилотом и им же исполняемых, может быть очень 
короток, до доли секунды. Критерии качества управления на этом нижнем 
уровне заключаются в обеспечении безаварийного полета, сохранности пасса- 
жиров и техники, качества пилотирования и т. п. В этом процессе управления 
на «нижнем» уровне имеются моменты, когда у пилота оказывается возмож- 
ность выбора: например, куда именно лететь после взлета с аэродрома и каким 
именно маршрутом лететь. В эти моменты пилот обращается к указаниям 
штурмана, который сообщает ему, по какому именно маршруту и к какой 
именно цели следует лететь (если пилот не возражает в силу особенностей 
текущей обстановки). Штурман в данном случае играет роль системы управ- 
ления более высокого уровня, потому что он оперирует более протяженными 
по времени закономерностями. Штурман управляет маршрутами, трассами, 
аэродромами, временами порядка часов, решения он принимает редко, и эти 
решения имеют длительный период актуальности, например одно решение, 
принятое штурманом, может выполняться в течение нескольких часов. В ка- 
честве датчиков штурман использует радио и документы, с помощью кото- 
рых ему сообщают о цели полета. Свои решения штурман выражает в виде 
знаков, рисуемых им на карте. Качество управления штурмана как системы 
управления оценивается по иным критериям, нежели в случае пилота. Это — 
минимизация пути от взлета до места посадки, это и безопасность выбранного 
маршрута, и удовлетворение всем другим требованиям, предъявляемым к 
работе штурмана. Штурман, однако, тоже не все решения принимает сам, 
а получает некоторые важные указания сверху, а именно, ему указывают, 
когда и куда должен лететь данный борт. Это указания от системы управ- 
ления еще более высокого уровня — от руководителя полетов. Эта система 
управления принимает решения, опираясь на еще более продолжительные 
закономерности — утвержденные расписания полетов, поступившие из штаба 
планы боевых действий и т.п. Датчиками для этой системы управления служат 
служебные документы, законы, СМИ, другие источники информации. Свои 
решения эта система управления выражает в виде устных или документальных 
распоряжений. Период актуальности этих решений может измеряться днями, 
неделями. Управление на этом уровне оценивается по своим критериям. 

Из сказанного следует, что системы управления различных уровней поль- 
зуются для принятия своих решений разными источниками информации, 
закономерности и периоды актуальности их решений существенно различны, 
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различны и критерии качества управления, обеспечиваемого этими системами 
управления. 

Следует заметить, что логически решение системы управления более вы- 
сокого уровня должно предшествовать во времени решениям систем управ- 
ления более низкого уровня. Так, пилот, спрашивая штурмана о маршруте, 
по которому ему следует вести самолет, получает от штурмана уже готовое 
решение, принятое тем до этого момента. В свою очередь, штурман, начиная 
прокладывать маршрут, уже должен иметь указание цели полета, переданное 
ему руководителем полетов. Тем самым, работа многоуровневых систем управ- 
ления хотя и может идти параллельно, но решения системы управления более 
высокого уровня должны предшествовать решениям системы более низкого 
уровня. При этом решения систем управления более высокого уровня переда- 
ются «вниз» через штатные каналы передачи и восприятия информации, как 
правило, в виде вербальных сообщений на определенном языке. Так, руководи- 
тель полетов сообщает свое решение штурману, например, по радио на языке 
слов. Штурман воспринимает эту информацию «штатными» датчиками — 
органами слуха, распознает ее и принимает решение о маршруте. Свое решение 
штурман выражает и передает пилоту тоже на вербальном языке, например 
в виде специальных знаков на карте. В свою очередь, пилот воспринимает 
указания штурмана, тоже с помощью «штатных» датчиков — системы зрения 
или слуха, после чего принимает свои решения, которые выполняются им же 
посредством физических воздействий на органы управления самолетом. 

Здесь, как можно было заметить, ничего не было сказано о сравнитель- 
ной важности команд систем управления «высокого» и «низкого» уровней. 
Важность решений систем управления разного уровня зависит не от уровня, 
а от стоимости выполнения или невыполнения решений. Например, в случае 
самолета «главным» на борту во время полета является пилот, потому что от 
его непосредственных действий, от того, как пилот управляет рулями, зависит 
жизнь пассажиров. Пилот может в сложной ситуации отменить распоряжения 
и штурмана, и руководителя полетов. Распоряжения штурмана являются 
в этом смысле менее критичными, в конце концов, пилот может найти выход 
из ситуации, в которую завел самолет штурман. Еще менее критичны в этом 
отношении распоряжения руководителя полетов. Их успешное выполнение 
может зависеть от уровня квалификации пилота и штурмана. 

Все сказанное о многоуровневом управлении отнюдь не обязательно 
должно реализовываться с помощью нескольких систем управления. Все это 
прекрасным образом может выполняться одной системой управления. Так, 
продолжая пример с самолетом, можно видеть, что все три рассмотренных 
функции экипажа вполне могут выполняться одним человеком. Например, 
собственник небольшого одноместного самолета, один может успешно играть 
роль и руководителя полетов, и штурмана, и пилота. Однако можно возразить, 
что в этом случае человек при выполнении разных функций пользуется раз- 
ными «датчиками». Что, выбирая цель полета, он может руководствоваться 
документами или радио, что, выбирая маршрут, он пользуется картами, а пи- 
лотируя самолет, он пользуется авиационными приборами самолета. В опреде- 
ленной мере это так, но ниже мы покажем пример иного рода. А здесь обратим 
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внимание на два обстоятельства. Первое, человек при таком многоуровневом 
управлении, действительно, разделяет время работы своей нервной системы 
на задачи разного уровня управления, отдельно решая эти задачи. При этом 
и свои собственные решения задачи более «высокого» уровня он передает 
самому себе как исполнителю более «низкого» уровня тоже через штатные 
каналы, точно так же, как он бы передавал их другому человеку. Например, 
он принимает решение лететь в такой-то город и вписывает его в документ — 
свое полетное задание. Затем в роли штурмана он обводит цель на карте 
карандашом, прокладывает и рисует на карте маршрут к этой указанной цели. 
Он передает сам себе эту карту и затем во время полета сверяется с этой картой 
точно так же, как он это делал бы при наличии указания штурмана. Часто 
бывает еще проще, человек говорит сам себе вслух: «так, теперь делаем то-то 
и то-то», слышит это сам и выполняет «распоряжение». Здесь мы, забегая 
вперед, вторгаемся в пределы языковых проблем, которые будут рассмотрены 
ниже. Тем самым, и в случае одного исполнителя многоуровневого управ- 
ления результат решения более «высокого» уровня должен предшествовать 
принятию решения на более «низком» уровне и быть передан этой же системе 
управления на вход для распознавания. 

Теперь покажем, что для организации многоуровневого управления не обя- 
зательно иметь разные датчики и исполнители. Представим себе взрослую 
лабораторную мышь, которая бегает по лабиринту, принимая решения. Можно 
видеть, что мышь демонстрирует многоуровневое управление. Она и ставит 
себе цель движения, и прокладывает к ней маршрут, и управляет движе- 
нием к цели, преодолевая препятствия. Тем самым, мышь решает одновре- 
менно несколько задач управления разных уровней. Однако мы видим, что 
у мыши нет таких источников информации, как документы, телефон, радио, 
СМИ ит. д., по которым она могла бы получать информацию, необходимую 
для принятия решений на верхних уровнях. Откуда же мышь берет необ- 
ходимую информацию? Очень просто — это информация о распознаваемых 
ею образах разного порядка (см. рис. 3.64). Если у мыши достаточно емкая 
память, а также развитый аппарат формирования и распознавания образов, 
и она способна распознавать уже образы разного порядка, то, наблюдая даже 
за одним параметром (например, наблюдая за последовательностью поворо- 
тов коридоров лабиринта), мышь в некоторых случаях может распознать 
свое положение в лабиринте, соответственно принять решение о цели своего 
движения и проложить маршрут к цели. Многоуровневое управление здесь 
обеспечивается просто работой с образами разных порядков. 

Из последнего примера нужно сделать важный вывод: многоуровневое 
управление можно организовать не за счет соединения нескольких систем 
управления в одну, но с помощью одной системы управления, работающей с об- 
разами разных порядков. Образы более высокого порядка и соответствующие 
им действия обеспечивают управление на более «высоком» уровне, а образы 
меньших порядков и соответствующие им действия обеспечивают управление 
на более «низком» уровне. Однако при этом не отменяется логика управления, 
которая требует, чтобы решение на более «высоком» уровне было принято 
раньше, затем озвучено через «штатные» каналы, воспринято системой распо- 
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знавания той же управляющей системы посредством своих штатных датчиков, 
распознано и использовано как аргумент для принятия решения более «низ- 
кого» уровня. Нейроноподобная реализация системы ААУ, которая была рас- 
смотрена выше, является удобным средством реализации многоуровневой си- 
стемы управления. В такой системе образы «низкого» порядка, — это нейроны 
подсистемы ФРО, расположенные в слоях, более близких к датчикам, а образы 
«высоких» порядков связаны с нейронами в слоях, расположенных дальше от 
датчиков. Действия, если их даже отыскивать методом перебора, подберутся 
такие, которые обеспечат реализацию решений соответствующего уровня. 

Эксперименты по моделированию описанного способа реализации системы 
управления в одной управляющей системе были успешно нами проведены 
на модели мобильного робота. 

В этом многоуровневом циклическом процессе управления большую роль 
играют языковые средства, которые система управления должна использовать 
для передачи команд самой себе, эта тема будет рассмотрена ниже. 

И, наконец, следует сказать, что и в природе, и в прикладных системах, 
конечно же, находится компромиссное решение, т. е. можно найти и специа- 
лизированные управляющие подсистемы, а можно найти и примеры много- 
уровневого управления, осуществляемого одной системой. В качестве примера 
специализированной и выделившейся из общей нервной системы подсистемы 
управления можно указать внутрисердечную периферическую нервную си- 
стему, которая является только одним из уровней управления работой сердца. 
Эта подсистема, работает с процессами, имеющими характерное время порядка 
секунды. Вместе с тем в управлении сердцем участвует и центральная нервная 
система, которая может работать с процессами с характерными временами 
порядка минут. Например, при распознавании (предсказании) мозгом ситуа- 
ции, когда организму вскоре предстоит большая нагрузка (например, придется 
быстро бежать), кора заранее посылает сердцу команды, которые заставляют 
его работать интенсивнее, приготовляясь к ожидаемым нагрузкам. 

Наиболее простым способом реализации многоуровневого управления с ис- 
пользованием системы ААУ может быть и такой способ, когда на «нижнем» 
уровне управления работает некоторая быстродействующая система, управле- 
ния, режим работы которой зависит от некоторых параметров. Подбор опти- 
мальных значений этих параметров может происходить более медленно и на 
другом уровне управления специальной системой управления. Этот подбор 
оптимальных параметров может осуществляться и адаптивными способами, 
например, алгоритмами ААУ. Над этой конструкцией можно поставить и еще 
один этаж, в том числе — с системой ААУ, для подбора каких-то еще более 
высоких оптимизирующих параметров и т. д. Примером такой двухуровне- 
вой системы управления является разработанная нами модель управления 
сердечно-сосудистой системой [25], в которой параметры быстродействующего 
контроллера «нижнего» уровня оптимизировались системой ААУ, располагав- 
шейся на более высоком уровне. 

Как же обстоят дела с иерархическим управлением? Выше мы выяснили, 
что совсем не обязательно команды системы управления более «высокого» 
уровня являются в биологических системах управления обязательными для 
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системы управления более «низкого» уровня. Как не пренебрегает обычно 
пилот правилами пилотирования при выполнении задания своего «руководи- 
теля полетами», как обычно не наедет на пешехода и водитель, спешащий 
куда-то по указанию своего «начальника». Каким альтернативным целям 
отдать предпочтение в той или иной ситуации — зависит от конкретного 
соотношения эмоциональных оценок образов результатов, выработанных у 
данной управляющей системы. Если «начальник» так «воспитал» своего 
подчиненного, что за невыполнение команды последний распознает образ 
с такой отрицательной оценкой, что хуже для него не бывает, то, пожалуй, 
такая система управления «низкого» уровня и лоб расшибет при выполнении 
приказа от системы управления более «высокого» уровня. В общем же слу- 
чае при принятии решений происходит обычный выбор лучшего по оценке 
результата решения, ну а если системы управления объединяются в одну 
многоуровневую систему, то, значит, у них есть основания прислушиваться 
к командам друг друга. Это же в полной мере касается и многоуровневой 
системы управления, реализованной в одной системе. Здесь эмоциональная 
оценка ожидаемого результата выполнения долгосрочной программы может 
быть более высокой, чем ожидаемая оценка выполнения некоторой кратко- 
срочной программы, потому, что это есть результат в некотором роде оп- 
тимизации на большом интервале и он может дать большую оценку, чем 
краткосрочные действия. Например, если мы сознательно решили начать 
некоторую долгосрочную программу, скажем — учебу в институте, в расчете 
на то, что со временем это даст нам больший выигрыш, чем другой образ 
жизни, то мы будем отдавать предпочтение выполнению этой программы 
в случаях, когда надо выбирать между отдыхом в праздничные дни или 
чтением учебников и т. п. Если же долгосрочную учебу ученику навязали 
родители, то у него с этой программой не связаны высокие эмоциональные 
оценки, и он может при всякой возможности отдавать предпочтение более 
очевидным развлечениям. 

Таким образом, многоуровневое и иерархическое управление в рассматри- 
ваемых бионических системах — это вполне реализуемая вещь, в том числе — 
на основе рассмотренных нейроноподобных вариантов систем ААУ. 
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Способность говорить, писать, высказывать свои мысли и понимать сказанное 
другими всегда рассматривалась как дар свыше, ниспосланный человеку, 
чтобы отличить его от иных представителей живого мира. Несмотря на то, 
что языку во все времена уделялось большое внимание в человеческой куль- 
туре и изучению этого феномена посвящено огромное количество научных 
исследований, с кибернетической точки зрения проблема возникновения языка, 
рассматривается довольно редко. В основном анализу подвергаются такие 
стороны языка, которые позволяют автоматизировать передачу, прием и рас- 
шифровку сообщений, — формализация протоколов языковых сообщений, 
вопросы кодирования, в том числе — помехоустойчивого, вопросы формали- 
зации семантики, проблема машинного перевода с одного языка на другой. 
Однако нам представляется, что некоторые важные аспекты языка, связанные 
с его ролью в феномене развивающихся автономных управляемых объектов — 
живых организмов, до сих пор остаются вне круга внимания исследовате- 
лей. По нашему убеждению, язык, с одной стороны, является органическим 
следствием развития автономных адаптивных систем управления, а с другой 
стороны, он существенно повышает эффективность управления в автономных 
управляемых системах, порождая новые возможности как самоуправления 
одного организма, выводя его на качественно новый уровень, так и управления 
в коллективе организмов. Рассмотрим некоторые стороны феномена языка, ко- 
торые выявляются методологией автономного адаптивного управления (ААУ). 


4.1. Свойства нейрона, порождающие язык 


Вернемся к модели нейрона, разработанной для метода ААУ (см. п. 3.2.1). 
Как было объяснено, нейрон по необходимости должен выработать средства, 
обеспечивающие ему возможность работы с зашумленной информацией — воз- 
можность распознавать образ при наличии помех в наблюдаемом прообразе. 
Эта необходимость реализовалась в способности нейрона распознавать образ 
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в условиях, когда наблюдаемый прообраз содержит не весь комплект данных, 
которые использовались для обучения нейрона. Если наблюдаемый прообраз — 
это некоторый бинарный вектор, где значащими сигналами являются единицы, 
то нейрон должен уметь распознать образ, даже если во входном векторе 
не хватает некоторого числа, единиц. Степень допустимого искажения прооб- 
раза, доля отсутствующих единиц должны подчиняться некоторому правилу, 
которое в модели нейрона мы формализовали в виде правила, В, выраженного 
пороговой функцией «И», в которой порог р уменьшается в зависимости от 
числа № наблюдений прообраза, накопленного счетчиком Г, нейрона (рис. 3.16) 
в течение жизни нейрона. Как отмечалось, допустимая нехватка компонент 
в прообразе может использоваться: 


а) для распознавания образа в условиях помех, 

б) для распознавания образа при неполной информации, 

в) для прогнозирования — распознавания образа с упреждением по вре- 
мени, т.е. раньше, чем закончится демонстрация прообраза, что исполь- 
зуется в описанных выше механизмах принятия решений, 

г) для порождения ассоциативно связанных образов, и, наконец, 

д) для порождения языка. 


Рассмотрим последнее. 

Возьмем связку из трех нейронов Па, ть, и п. (рис. 4.1). Пусть на ней- 
рон п. поступают сигналы от образующих прообраза некоторого объекта А, 
а на нейрон ль — сигналы от образующих прообраза некоторого объекта В. 
Пусть эти нейроны уже обучены и распознают эти объекты. Пусть предъ- 
явление этих объектов и их распознавание происходят одновременно, что 
приводит к обучению нейрона п. Нейрон п. срабатывает, когда в очередной 
раз одновременно распознаются оба объекта. Через некоторое время порог 
в нейроне п. уменьшается до величины менее 50%. После этого нейрон йе 
начнет срабатывать как при распознавании обоих объектов А и В, так и при 
распознавании только одного из них. Получается так, что один из этих объек- 
тов как бы заменяет, идентифицирует собой другой объект. Нейрон пе здесь 
устанавливает ассоциацию одного образа с другим. Порожденный им образ О, 
можно назвать ассоциативным образом, так как он ассоциирует два других 
образа. 


— Па 

А — 
_ Тс 
— ть 
— 

Р о 
_— 


Рис. 4.1. Конструкция из нейронов, в которой может возникнуть 
явление идентификации — основа языка 
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Предположим, что объект А — это некоторый природный объект, который 
редко появляется в поле зрения и управлять которым трудно. Например, 
это солнце. Объектом В пусть будет некоторый процесс или вещь, которую 
достаточно легко можно продемонстрировать управляющей системе, например 
это звук свистка. Тогда образ объекта А (солнца) может быть распознан 
либо при наблюдении реального солнца, либо при наблюдении солнца и звуке 
свистка вместе, либо только при наблюдении объекта В — свистка. Последний 
случай решительно отличается от первых двух в том отношении, что показать 
кому-либо реальное солнце можно далеко не всегда, нельзя этого сделать 
ночью или в пасмурный день, но свистеть в свисток можно в любое время. Тем 
самым появляется возможность вызвать в УС распознавание образа, солнца, 
в любой момент, а не только тогда, когда солнце реально наблюдается на небе. 

Если имеется множество легкодоступных для воспроизведения объектов, 
которые используются для идентификации, вербализации множества реаль- 
ных объектов или процессов, то первое множество представляет собой множе- 
ство языковых объектов, вербализующих реальные объекты. Это множество 
составляет воспринимаемую часть языка, обеспечивая процесс слушания и по- 
нимания информации. 

Пусть теперь у ОУ выделилось некоторое множество действий, на- 
правленных на демонстрацию другому ОУ или самому себе объектов- 
идентификаторов В. Это множество действий также имеет отношение к языку, 
и именно к активному аспекту языка, к процессу говорения, передачи инфор- 
мации. 

Совокупность языковых идентификаторов объектов и процессов их демон- 
страции мы и называем «языком». 

Для того чтобы некоторое множество объектов или процессов реального 
мира могло играть роль языковых объектов — идентификаторов, и языковых 
действий, необходимо, чтобы эти объекты и процессы их генерации были 


а) многочисленны, так как их число должно быть сравнимо с числом 
реальных наблюдаемых объектов, 

б) разнообразны и помехоустойчиво различимы распознающей систе- 
мой УС, 

в) энергетически малозатратны, чтобы ими можно было легко, быстро 
и удобно пользоваться (например, можно использовать в качестве языка, 
стук двух камней друг о друга и азбуку Морзе в качестве протокола, 
но разговор на таком языке требует больших затрат физической энергии 
и очень медленный). 


Назовем такие физические объекты и действия, используемые организмом 
в качестве языка, физическими носителями языка. 

В живой природе мы можем наблюдать множество самых разнообразных 
языковых явлений. Это и крики животных, и язык жестов, и язык запахов. Та- 
кие объекты и процессы активно используются в животном мире для передачи 
вербальной информации — животные с помощью этих средств предупреждают 
друг друга об опасности, сообщают друг другу о местонахождении пищи, учат 
друг друга правилам оптимального поведения в различных ситуациях и т. п. 
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Очевидно, что живому организму совсем не просто найти такие объ- 
екты и процессы, которые он мог бы использовать в качестве физиче- 
ского носителя языка, чтобы они удовлетворяли перечисленным выше усло- 
виям. В самом деле, что может использовать для организации языка, на- 
пример, корова? Ее горло способно издавать всего несколько различных 
звуков, ее язык жестов очень тяжеловесен — стучание копытом в землю 
или размахивание рогами — не слишком удобное средство для разговора. 
По-видимому, отсутствие удобного физического носителя языка и явля- 
ется основной причиной относительной неразвитости живого разговорного 
языка у животных. Подтверждением этого тезиса служит пример знамени- 
той обезьяны Коко, которую научили языку пальцев, используемому глу- 
хонемыми людьми. Этот язык пальцев относительно легок для воспроиз- 
ведения и позволяет людям восполнить недостаток устного языка. Когда 
Коко освоила этот язык, она стала охотно им пользоваться для разговора 
с людьми, и оказалось, что с ней вполне можно поговорить на разные 
темы. Это очень впечатляющее открытие, и о нем в Интернете можно 
найти много информации. При изучении речей Коко открываются разные 
очень занятные вещи, в том числе психологического свойства. Так, на- 
пример, Коко позиционировала себя как человека, противопоставляя себя 
другим обезьянам, и не хотела учить языку других обезьян, боясь поте- 
рять свое преимущество перед ними. В последнее время появились сооб- 
щения о повторениях этих опытов с приматами, которые демонстрируют 
действительно разумную речь. Интересна, например, следующая информа- 
ция [28]: 


«Обезьяны любят рисовать. Обычно они чертят красками на бумаге бессмыс- 
ленные полосы и закорючки. Однако в один прекрасный день молодая шимпанзе 
Мойя нарисовала нечто, напоминающее не то рыбу, не то самолет. Когда ее 
спросили, что это такое, она ответила: «Это птица». Да, именно так: ответила! 
Мойя, как и другие молодые обезьяны — Пили, Татус, Коко и Уоши, — обучена 
специальному языку знаков и умеет составлять простые, лишенные грамматики, 
но все же понятные фразы. И отсутствием грамматики, и небольшим, около 
300 слов (что еще интереснее, Уоши стала самостоятельно учить своего сына 
языку знаков, и пятилетний детеныш усвоил их почти 500), запасом «обезьяний 
язык» напоминает речь двухлетнего ребенка. И подобно постигающему мир 
ребенку, Уоши могла долго изучать свою физиономию в зеркале, а потом протя- 
нуть к изображению руку и сказать ошеломленному экспериментатору: «Это я», 
поставив под сомнение известный тезис, будто животные не способны выделить 
себя из окружающего мира. Не забудем, однако, что обезьяна оказалась на это 
способной только благодаря общению с людьми!». 


Надо понимать при этом, что для того, чтобы сложился действительно 
развитый язык, с богатыми словарями, образами, развитыми структурами 
времен и падежей и т. д., он должен развиваться веками и при большом 
множестве членов социума. Но, тем не менее, указанные опыты с обезьянами 
говорят о реальности этих механизмов. 
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Итак, вернемся к рассмотрению возможных механизмов появления языка, 
в нейроноподобных системах управления. 

Покажем, например, как можно организовать обучение УС ААУ язы- 
ковым идентификаторам объектов. Соединим конструкцию, изображенную 
на рис. 4.1, с описанной в разд. 3.2.1] нейроноподобной Базой Знаний 
(рис. 4.2). 

Пусть нейрон п. отвечает за распознавание реального объекта, а нейрон 
ть — за распознавание его языкового идентификатора. Пусть сформировался 
образ О. и в Базе Знаний обучились некоторые нейроны, говорящие о том, 
какие действия можно совершать при распознавании этого образа, (например, 
это действие О). Независимо от этого мог сформироваться и образ Оь объ- 
екта, который пока еще не стал языковым идентификатором (например, это 
звук свистка). Для этого образа в БЗ тоже могли сформироваться какие-то 
адекватные действия (например, это поворот уха в сторону источника свиста, 
чтобы лучше его слышать), пусть это будет действие Р,,. Пусть теперь неко- 
торый учитель организовал совпадение появлений обоих образов (например, 
стал свистеть каждый раз при появлении данного объекта). В результате 
начнет обучаться и через некоторое время обучится нейрон пс. Теперь при 
одновременном появлении объекта и звуке свиста каждый раз будет распо- 
знаваться ассоциативный образ О‹. Пока у нейрона п. порог р не снизится 
меньше чем на 50% и не заполнится его счетчик С, все три образа Оз, Оь 
и О. будут распознаваться одновременно. Благодаря тому что в БЗ одно- 
временно со слоем, соответствующим образу Ос, будут инициированы слои, 
соответствующие действиям Р, и От, а также образам результатов, в БЗ 


Действия 


Образы 


результата О’ Ры Образы 


а +—1 
действия 2; 


Образ объекта- 
идентификатора 


Образ 
реального 
объекта - 


Образы условия О"? 


Рис. 4.2. Конструкция из нейронов, обеспечивающая возможность формирования 
языковых идентификаторов объектов 
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Рис. 4.3. В процессе управления циклически повторяется 
указанный цикл распознаваемых образов 


в слое Ос обучатся те нейроны, которые соответствуют действиям, общим 
для образов О, и Оь. После заполнения счетчика С нейрона п. этот нейрон 
при распознавании образа начнет посылать отключающие сигналы нейронам 
па и ть. В результате при распознавании образа п. БЗ будет откликаться 
только действиями, специфичными для образа Ос. Когда порог р у нейрона пе 
снизится более чем на 50%, то нейрон пс начнет срабатывать не только при 
распознавании образов Од и Оь одновременно, но и при распознавании только 
одного из них, например при звуке свистка. Тем самым, ассоциативный образ 
Ос теперь будет распознаваться либо при наблюдении реального объекта, либо 
при одновременном распознавании объекта и его идентификатора, либо при 
распознавании только его языкового идентификатора (свистка). База Знаний 
и система принятия решений теперь будут реагировать одинаково во всех этих 
случаях. А внешний наблюдатель теперь получает возможность с помощью 
свистка в любое время вызывать у УС реакцию, которую раньше она демон- 
стрировала только при наблюдении данного реального объекта. Сказанным мы 
смоделировали условный рефлекс, который демонстрируют животные. Ниже 
мы покажем реальные примеры этого эффекта. 

Очевидно, что аналогичным способом можно сформировать идентифика- 
торы и для других образов, участвующих в цикле управления. Для этого 
надо только иметь нейроны, способные ассоциировать распознавание реаль- 
ных образов с образами-идентификаторами. Изобразим временную последова- 
тельность образов, составляющих цикл управления (рис. 4.3). Одновременно 
работает несколько таких последовательностей, наложенных друг на друга, 
как слоистый пирог. В каждом слое могут быть образы разной длительности. 

Поскольку каждый из образов — образы условий, образы результатов, 
образы действий, включая оценки, реализуется на нейронах (оценки, по сути, 
тоже можно назвать образами, так как они могут быть реализованы на та- 
ких же нейронах), то существует возможность установления ассоциаций всех 
этих образов с образами — их идентификаторами (рис. 4.4). Последние мо- 
гут быть связаны с воздействиями, удобными для языковых команд. Если 
в сети имеются нейроны, необходимые для создания ассоциативных обра- 
зов, то возможность формирования необходимых учителю языковых образов- 
идентификаторов связана с правильной организацией процесса обучения. Про- 
образ нужного языкового образа (а это может быть тот же свисток, звук 
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Рис. 4.4. Каждому из образов, участвующих в цикле управления, 
можно поставить в соответствие идентификатор 


или различимое подсистемой формирования и распознавания образов слово) 
должен предъявляться в нужный момент, одновременно с тем прообразом, ко- 
торый мы хотим идентифицировать, и достаточное число раз, чтобы нужный 
ассоциативный нейрон смог обучиться, т. е. здесь вопрос переходит в плоскость 
проблем «методики обучения» и требует специальных знаний и подходов. 

Если образуются ассоциативные образы условия, действия, результата или 
оценки с языковыми образами, то такими языковыми образами можно под- 
менять соответствующие образы реальных объектов, целенаправленно воз- 
действуя на процесс управления. Возможности такого влияния самые разно- 
образные и определяются методикой использования. Следует предположить, 
что с помощью таких идентификаторов можно управлять не только обра- 
зами, но и действиями и оценками. Например, можно скорректировать оценку 
некоторого образа, если некоторое число раз при его появлении «говорить» 
системе, что это «плохо», предварительно сформировав образ слова «плохо» 
с отрицательной оценкой. Развитие этого аппарата, по-видимому, ведет к фор- 
мированию языка с его временами, падежами и прочими атрибутами. 

В своих практических работах моделировать языковые явления мы начали 
недавно. Первые эксперименты проведены нами на системах ААУ, управля- 
ющих движением моделей автономных мобильных роботов, результаты пред- 
ставлены в работе [29]. 
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Вернемся к рисунку, изображающему систему «среда — объект управления — 
управляющая система» в целом (рис. 4.5 (а)). Как было сказано в данной 
главе, языковыми могут быть прообразы, наблюдаемые УС на своих входах, 
и действия на выходе УС. Но, глядя на рисунок, можно видеть, что и то 
и другое может быть связано как с циклом а —#й — 4 —1— а — , пролегающим 
через УС, исполнительные устройства, среду и блок датчиков, так и с циклом 
а — 6—, пролегающим внутри ОУ. 

Если языковые объекты и действия принадлежат первому из этих цик- 
лов, т.е. пролегают через внешнюю среду, то такой язык можно назвать 
внешним. языком. Выделим языковые действия и объекты внешнего языка 
и расположим их на рис. 4.5 (б) в виде отдельного маршрута 4’. Внешний язык 
может использоваться двумя основными способами: для общения с другими 
объектами, находящимися во внешней среде и понимающими этот язык, и для 
общения ОУ с самим собой. 

Если языковые объекты и действия принадлежат второму из этих циклов, 


т.е. пролегают внутри ОУ, то такой язык можно назвать внутренним, языком. 
Внутренний язык может использоваться для общения ОУ с самим собой. 
Рассмотрим эти возможности подробнее. 


Рис. 4.5. Схема системы «среда — объект управления — управляющая система», 
которую можно использовать для классификации языков 


4.3.1. Внешний язык 


Определение. Совокупность входных и выходных воздействий ОУ, являю- 
щихся идентификаторами для ОУ и частично — для среды 5, есть внешний 


язык ОУ. 


Внешний язык может, по-видимому, органически формироваться из обыч- 
ных образов и действий, которые за счет ассоциативных способностей нервной 
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сети приводят к тому, что одни образы могут идентифицировать другие. Нал 
пример, запах или звук какого-то объекта, могут ассоциироваться у животного 
с самим этим объектом. В этом случае этот запах или этот звук начинают 
играть определенную языковую роль, и здесь практически невозможно прове- 
сти грань, отделяющую язык от других явлений природы, т. е. в обиходном 
выражении «понимать язык природы» есть большая доля смысла. В свою 
очередь, трудно провести грань, отделяющую обычные действия животного от 
языковых действий, направленных на вербальную передачу образов другим 
животным. Так, крик, звук шагов, изменение формы тела, растопыривание 
перьев и многие другие действия животных носят явно языковый характер. 
Специализация таких действий и образов может приводить к развитому языку, 
который и наблюдается у животных. Эффективность такого языка, как отме- 
чалось выше, в большой степени зависит от возможности использования форм, 
требующих малого расхода энергии, обладающих большим разнообразием, 
высокой помехозащищенностью и дальнодействием. 

Что именно вербализирует внешний язык? По-видимому, в своей перво- 
начальной форме он вербализирует, идентифицирует прямые и косвенные 
признаки реальных объектов в среде другими реальными, неспециализиро- 
ванными в языковом смысле, объектами. Постепенно система языковых объ- 
ектов и действий специализируется, как расширяется и круг идентифициру- 
емых этим языком объектов, процессов и действий и в среде, и в объекте 
управления. Вербализируются и информационные процессы, происходящие 
уже внутри управляющей системы. Например, животное может обозначать 
языковыми знаками свои намерения (атаковать, ретироваться, сексуальные 
намерения и т. п.). 

Внешний язык может использоваться множеством живых организмов раз- 
ных биологических видов, одного вида и собственно самим животным — 
субъектом этого языка. 

Примеры использования одного внешнего языка животными разных видов 
демонстрирует любой биоценоз, где животные разных видов понимают один 
общий язык, которым передается информация о претензиях на приоритеты 
в использовании территории, информация об опасности, информация о на- 
мерениях и другая. Пусть способности производить и понимать различные 
элементы (слова) этого общего языка доступны животным разных биоло- 
гических видов в разной мере, тем не менее, это их общий язык. Можно 
указать и одинаковые языковые действия, целенаправленно производимые 
животными разных видов и для животных разных видов. Например, громкие 
крики для предупреждения других животных о приближении крупного хищ- 
ника, оскаливание для выражения своих агрессивных намерений, помечивание 
секретами границ своей территории и т. п. Основное назначение внешнего 
языка в этом его проявлении состоит в прогнозировании и упреждающем 
управлении. Животные заранее распознают ту или иную приближающуюся 
ситуацию и используют это опережающее действительность распознавание 
для такого управления, которое позволит уйти от надвигающейся опасности. 
Однако возможны и другие назначения внешнего языка в этом его варианте. 
Это, например, обучение животных одного вида животными другого вида. 
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Свежий пример представляет собой недавняя телевизионная информация 
о зарегистрированном факте воспитания брошенного ребенка кошкой, которая 
научила его ходить на четвереньках, защищаться и угрожать когтями, рычать, 
питаться определенным образом, лечиться определенной травой и т. д. 

Наиболее адекватно внешний язык понимается и производится, конечно, 
представителями одного биологического вида. Здесь развитие языка может 
доходить до очень высокого уровня. Примером является и человеческий язык. 
Назначение внешнего языка здесь наиболее разнообразно. Это и предупре- 
ждение, и обучение, но главная возможность — это моделирование процессов 
в среде, что позволяет обоснованно принимать решения. 

Можно говорить, что внешнему языку может принадлежать его пересе- 
чение с некоторым языком, понятным другим управляющим системам во 
внешней среде — лексикой. 

Наконец, внешний язык может использоваться и одним животным, когда 
языковое действие совершается целенаправленно для того только, чтобы са- 
мому же его и воспринять, т. е. во внешнем языке выделяется подмножество 
действующего запаса языка, которое объект управления может использовать 
для моделирования и без участия другой управляющей системы во внешней 
среде. Действующему запасу языка принадлежит подмножество скрытого за- 
паса языка, которое пересекается с внутренним языком. Примером в животном 
мире могут служить игры одиночных животных. Здесь некоторые действия 
из языкового репертуара совершаются специально для того, чтобы самому 
же их воспринять и на них отреагировать. Например, рычание, поднятие 
шерстяного покрова дыбом, игры со своим хвостом, прыжки и принятие 
специальных знаковых поз и т. п. — это все языковые действия. Восприняв 
самим же собой поданный знак, животное реагирует на него, как на знак, 
поданный другим животным — нападает, пугается, отступает, убегает и т. п., 
понимая при этом условность причины, и даже, как утверждают специа- 
листы, — недвусмысленно проявляя чувство юмора. Совершенно очевидно, 
что целью такого поведения является моделирование определенных реаль- 
ных процессов, характерных для среды. Смысл подобного поведенческого 
акта может быть примерно таков — животное как бы говорит себе: «Что, 
если возникнет угроза, как я себя поведу?», далее моделируется нападение 
«страшного зверя» с помошью условной «угрожающей» позы с последующей 
своей естественной (согласно знаниям из своей Базы Знаний) реакцией на эту 
ситуацию — убегание или другое действие. Самый сложный момент здесь — это 
побуждение к началу такого акта. Конечно, в большой степени инициирование 
такого поведения уже запрограммировано и вызывается рефлекторно в свое 
время и в определенных обстоятельствах. Но объективной причиной для 
возникновения такого поведения или самой программы такого поведения явля- 
ется естественная потребность в получении информации от своих сенсоров — 
потребность в смене впечатлений. А за этой потребностью стоит неоднократно 
рассматривавшаяся выше целевая функция накопления новых знаний, которая 
требует совершения новых действий и наблюдения новых ситуаций. Прямым 
прагматическим следствием и, возможно, непосредственной причиной такого 
поведения является самообучение, освоение новых навыков, тренировка, своих 


4.3. Язык и мышление 241 


возможностей, что дает животному очевидное средство и преимущество в 
борьбе за выживание. 

Особо выделим и еще раз подчеркнем возможность использования внеш- 
него вербального языка для моделирования реальных процессов. Пусть 
(рис. 4.5) маршрутом 9 запущен некоторый реальный процесс, восприня- 
тый УС. Тогда, если у ОУ есть внешний язык (маршрут 4’), то УС может его 
использовать для моделирования возможных вариантов реальной эволюции 
с целью выбора более удачного ее варианта. При этом цикл 4 — 1 — а — 
й —4’-... может повториться несколько раз, пока управление не перейдет 
на другой маршрут, например, на маршрут 4 — воздействие на реальные 
объекты в среде. В результате УС совершает более обдуманное решение, чем 
в случае, если бы решение было продиктовано простой реактивной цепочкой 
4 —1— а - 1 - а. В процессе моделирования посредством внешнего языка 
могли участвовать находящиеся в среде один или несколько субъектов, пони- 
мающих этот язык, а могли и не участвовать. В этом случае языковое мо- 
делирование происходило в процессе «разговора» УС с собой. Последний вид 
моделирования мы часто используем на практике, когда, принимая какое-то 
решение, сами с собой разговариваем вслух, пользуясь устными языковыми 
идентификаторами (словами). Или когда, например, решаем геометрическую 
задачу, вычерчивая различные геометрические построения, рассматривая их, 
находим новые свойства и вновь чертим, пользуясь языком графических 
символов. Только когда будет получен удовлетворяющий результат, мы можем, 
руководствуясь полученным чертежом, совершить воздействие на реальную 
среду, например, что-то отрезав или построив. Очень интересный вид моде- 
лирования — изобразительное искусство, когда человек изображает что-то 
на холсте, сам это рассматривает, что-то новое понимает, дорисовывает, и по- 
вторяет этот цикл много раз. 

В таком моделировании центральную роль играет не язык, а База Знаний, 
содержащая наши эмпирически найденные, логически выведенные или полу- 
ченные от учителя знания о свойствах системы, мира. Язык служит только 
инструментом обращения к Базе Знаний, как говорят компьютерщики — 
интерфейсом или СУБД. Пропесс моделирования состоит в испытании своей 
Базы Знаний и наблюдении за ее реакциями. Мы спрашиваем свою БЗ: «Что 
будет, если в таких-то условиях я сделаю то-то?» Спрашиваем, пользуясь 
языковыми идентификаторами. База Знаний «отвечает» нам: «Получится 
такой-то результат». Отвечает БЗ реальным действием, как ей и положено. 
Но мы, помня, что запрос был пробным, не позволяем своим исполнительным 
органам выполнять это решение, выданное Базой Знаний, мы специально 
блокируем решение, поняв, в чем оно состоит. Либо переводим это решение БЗ 
в вербальную форму — например, произносим, рисуем или пишем: «получится 
то-то и то-то». 

Вербальное представление результата, выданного Базой Знаний при проб- 
ном обращении к ней с помощью языковых средств, очень полезно, так как 
этот образ результата можно опять подать на вход Базы Знаний и посмот- 
реть, что получится на следующем шаге. Таким способом можно испытывать 
свою или чужую Базу Знаний последовательно много раз, получая длинные 
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многоходовые прогнозы, которые могут привести к полезным решениям. Оче- 
видно, что такое многошаговое последовательное вербальное моделирование 
может приводить к накапливающейся ошибке. Ошибки прогнозирования при 
принятии решений могут дорого стоить субъекту. Чтобы повысить точность 
многошагового прогнозирования, Природа предлагает несколько путей. 

Во-первых, работает естественный отбор. Те субъекты, моделирование ко- 
торых шло неправильно, либо их язык общения с БЗ был неэффективен, уже 
давно вымерли по этой же причине — они погибли от результатов своего непра- 
вильного моделирования: упали в яму, не рассчитав силу прыжка, попали 
хищнику в зубы, неправильно рассчитав траекторию погони и т. д. Оставались 
в живых те индивиды, которые умели правильно, эффективно и своевременно 
моделировать реальные процессы. 

Во-вторых, находились и развивались формальные средства повышения 
правильности моделирования. Например, в человеческом языке появилась 
и развилась логика. Появилась и развилась математика как система строгих 
обоснованных выводов результатов из исходных данных в формальных систе- 
мах. На практике используются и другие виды логик, а также разнообразные 
средства повышения надежности умственного моделирования — рациональное 
мышление, здравый смысл, опора на опыт, «житейская логика», обращение 
к авторитетам, коллективное принятие решений и т. д. и т. п. 

Третий путь увеличения надежности моделирования — это проверка его 
результатов на практике, которая всеми признается как «критерий истины». 
Если этот способ игнорировать, то его все равно реализует природа в есте- 
ственном отборе. Если же этот способ осознанно взять на вооружение, то он 
существенно повышает вероятность своевременного выявления и исправления 
ошибок в моделировании. 


4.3.2. Внутренний язык 


Определение. Система действий, инициирующих процесс 6 -+ а, и система 
образов-идентификаторов, инициирующих процесс а — 6, вербализующая в 
первую очередь процесс а — ћ — а -›1, называется внутренним языком ОУ. 


Внутренний язык может вербализовать и другие процессы в системе. Внут- 
ренний язык может позволить организму моделировать, например, взаимо- 
действие ОУ с внешней средой, не воздействуя при этом на нее. Имитируя 
посредством инициирования идентификаторов внутреннего языка последова- 
тельности воздействий среды, соответствующие одной из сформированных 
в Базе Знаний программ (например, выработанных в процессе (9)), ОУ апри- 
ори рассчитывает результат, который будет получен, если эту программу 
действий выполнить реально. Если в текущий момент имеется несколько 
альтернативных программ, то внутренний язык позволяет выбрать лучшую 
из них, моделируя их выполнение и сравнивая прогнозируемые изменения 
состояния объекта управления. 

Внутренний язык мог образоваться в результате постепенного развития 
внешнего языка, реализованного в маршруте @' (рис. 4.5), а именно, его под- 
множества, которое используется субъектом для «разговора» с самим собой. 
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Действительно, языковые средства, используемые для моделирования одним 
индивидом как «интерфейс» для взаимодействия со своей Базой Знаний, 
в своем постоянном развитии могли стать весьма эффективными. Их развитие 
могло идти по следующим направлениям. 

В силу того что уровень помех между источником и приемником языковых 
сигналов (между ртом и ушами, между руками, глазами и ушами) в одном 
организме существенно ниже, чем между источниками и приемниками, распо- 
ложенными на разных организмах, имеется возможность снижения мощности 
необходимых сигналов. Слова можно произносить тихо, жесты делать слабо- 
выраженными, на письме пользоваться небольшими по размеру и неяркими 
символами и т. п. Это приводит к развитию систем специальных маломощных 
языковых объектов. 

Поскольку в общении участвует только один конкретный субъект, то воз- 
никает возможность развития специальной одному ему понятной системы 
символов. Это могут быть недоговоренные слова, просто звуки, жесты и другие 
подобные объекты, которые могут быть непонятны другим субъектам. 

Роль языковых объектов могут играть уже только слабые напряжения 
мышц, например слабое напряжение голосовых связок, гортани и мышц языка, 
которые при передаче сообщения другому субъекту должны были бы рабо- 
тать гораздо энергичнее. Снятие и распознавание этих слабых возбуждений, 
играющих роль языковых действий, и, возможно, использование на этих же 
органах расположенных рецепторов в качестве органов, воспринимающих язы- 
ковые команды, уводит, втягивает петлю языковой обратной связи @' (рис. 4.5) 
внутрь тела организма, превращая ее в маршрут 6. Это принципиальный по 
важности момент, ибо он делает языковый акт невидимым извне организма. 
Язык становится внутренним. Факт движения языковой информации, модели- 
рования и принятия решений становится невидимым для окружающих. Такой 
маршрут распространения языковой информации делает ее почти абсолютно 
конфиденциальной, резко повышает ее помехозащищенность, быстродействие 
и эффективность. 

Возникновение внутреннего языка требует наличия двух основных состав- 
ляющих. Первая составляющая — это техническая возможность реализации 
внутреннего языка. Не надо думать, что она весьма распространенная. Внут- 
ренний язык явно имеет место у человека. Но существует ли он у других 
животных, мы не можем сказать уверенно, так как факт его наличия даже 
у человека мы можем подтвердить только на своем примере. Доказать его при- 
сутствие у другого человека — задача весьма непростая, так как природа при- 
ложила много усилий для того, чтобы замаскировать проявления внутреннего 
языка, скрыть его от внешних наблюдателей, что повышает защищенность 
субъекта. Видимо, для того чтобы подтвердить наличие внутреннего языка 
даже у человека, необходимо провести сложные технические нейрофизиологи- 
ческие эксперименты. Вторая составляющая — это наличие собственно внеш- 
него языка, который отображается во внутренний язык. Если нет внешнего 
языка, то, по нашему убеждению, нет и внутреннего. Язык — это в большой 
степени плод социального развития организмов. Он развивается в результате 
интенсивного общения многих индивидов между собой. Известно, что слу- 
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чаи долговременной изоляции человека способны привести к деградации его 
внешнего языка. По-видимому, его жизнь становится все более реактивной, 
а процессы моделирования выхолащиваются. Поскольку мы не видим очень 
уж развитого внешнего языка у животных, причем такого языка, который 
допускал бы втягивание указанной петли обратной связи внутрь организма, то 
можно предположить, что внутренний язык — не слишком распространенное 
явление в животном мире. 


4.3.3. Мышление 


Рассмотренное нами явление языка в системах автономного адаптивного 
управления берет на себя довольно важную функцию — функцию модели- 
рования поведения системы, при этом поведение может быть многошаговым. 
Это весьма важное интеллектуальное свойство, по нашему мнению оно соот- 
ветствует мышлению в живом организме. Характерной особенностью рассмот- 
ренной модели мышления является то, что оно реализуется не где-то целиком 
внутри нервной системы, но реализуется через языковые обратные связи, 
пролегающие вне нервной системы. В свою очередь, маршруты обратных свя- 
зей, через которые реализуется язык, являются не более чем разновидностью 
обычных маршрутов через среду, с которыми и работают нервные системы. 
Следовательно, принципы работы нервной системы с языковыми образами 
и действиями в своей основе должны быть теми же самыми, что и с обычной 
неязыковой информацией. Действительно, поскольку языковая информация 
поступает на те же входы, что и обычная информация (слух, зрение, иногда 
осязание, обоняние), то нервная система работает с языковой информацией 
так же, как она обрабатывает обычную входную информацию. Так же обстоит 
дело и с языковой выходной информацией — используются те же «штатные» 
выходные воздействия, что и для обычного управления телом — движения 
членов, звуки, позы и т. д. Отсюда следует, что для размышлений организму 
нужно отключить хотя бы временно часть входов и часть выходов от работы 
с реальной информацией, для того, чтобы их можно было использовать для 
работы с вербальной информацией. Мы это можем наблюдать на своем при- 
мере: если нам нужно над чем-то подумать, мы стараемся закрыть глаза, 
организовать вокруг себя спокойную среду без отвлекающих раздражителей, 
требуем тишины. Высвобожденные таким способом рецепторы мы используем 
для подачи в свою нервную систему вербальной, языковой информации. В про- 
цессе размышления мы можем общаться со своей Базой Знаний, показывая или 
рисуя себе изображения, произнося вслух или «внутри себя» фразы. Когда 
мы начинаем размышлять, мы вначале где-то ставим себе «флажок», что 
сейчас будет использоваться не настоящая, а вербальная информация, поэтому 
на решения и команды Базы Знаний не нужно реагировать реально. Когда 
окончательное решение принято и мы возвращаемся к «реальной» жизни, мы 
снимаем «флажок» и снова наши исполнительные органы начинают исполнять 
команды по реальному управлению нашим телом. 

Известно, например, что основные интеллектуальные операции человек 
выполняет с помощью лобных долей, которые некогда работали с информа- 
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цией, поступавшей от системы обоняния, т. е. в процессе эволюции произошло 
высвобождение становящихся второстепенными входных трактов системы рас- 
познавания и их специализация для работы с вербальной информацией. 

Можно предположить, что у людей, большую часть времени работающих с 
вербальной информацией, моделированием, крепление указанного «флажка» 
от частого употребления может разбалтываться, вследствие чего флажок мо- 
жет часто падать невпопад. В результате этого такой человек начнет все чаще 
и неожиданно для невинных наблюдателей отвечать реальными действиями 
на свои виртуальные внутренние мыслительные процессы. Не есть ли это 
причина какого-либо психического заболевания? 

Мы планируем провести компьютерное моделирование рассмотренных яв- 
лений и эффектов, так как приведенное описание представляется достаточно 
конструктивным. 
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5.1. Современные системы искусственного интеллекта 


Итак, мы рассмотрели новый подход к построению систем автономного адап- 
тивного управления (ААУ), который, по нашему убеждению, воспроизводит 
некоторые основные черты принципов действия естественных систем управле- 
ния — нервных систем. Большинство из рассмотренных конструкций и алго- 
ритмов были нами реализованы в виде программных моделей и продемонстри- 
ровали свою работоспособность. На основе этих решений были разработаны 
прототипы систем ААУ для прикладных объектов, которые будут рассмотрены 
в гл. 6. Однако сейчас мы позволим себе сделать философское обобщение, 
в котором попытаемся охарактеризовать систему, которую мы разработали, 
и сравнить ее с системами искусственного интеллекта, в их современном пони- 
мании. 

Понятие искусственный интеллект (термин введен Дж. Маккарти на пер- 
вой конференции по этому вопросу в 1956 г.) до настоящего времени не по- 
лучило удовлетворительного определения. Это связано с тем, что само по- 
нятие интеллекта, по словам А. Эндрю, имеет «скользящий» характер, т. е. 
изменяется со временем. Однако разработки по искусственному интеллекту 
оставляют практически полезные программные системы. Ряд выделившихся 
направлений таких систем сейчас в большинстве случаев и понимают под 
искусственным интеллектом (ИИ). Это системы распознавания образов, экс- 
пертные системы, искусственные нейронные сети, программы для перевода 
текстов с одного языка на другой, роботы, игровые программы и некоторые 
другие. Сегодня термином ИИ принято обозначать кибернетические системы, 
моделирующие некоторые стороны интеллектуальной деятельности человека. 

Приведем большую цитату из книги Люгера [30], характеризующую совре- 
менное отношение к понятию искусственного интеллекта. 


«Искусственный интеллект можно определить как область компьютерной 
науки, занимающуюся автоматизацией разумного поведения... ИИ рассматри- 
вается как часть компьютерной науки, которая опирается на ее теоретические 


5.1. Современные системы искусственного интеллекта 247 


и прикладные принципы. Эти принципы сводятся к структурам данных, исполь- 
зуемым для представления знаний, алгоритмам применения этих знаний, а также 
языкам и методикам программирования, используемым при их реализации. Тем 
не менее, это определение имеет существенный недостаток, поскольку само 
понятие интеллекта не очень понятно и четко сформулировано. Боль- 
шинство из нас уверены, что смогут отличить «разумное поведение», когда с ним 
столкнутся. Однако вряд ли кто-нибудь сможет дать интеллекту определение, 
достаточно конкретное для оценки предположительно разумной компьютерной 
программы и одновременно отражающее жизнеспособность и сложность челове- 
ческого разума. Итак, проблема определения искусственного интеллекта 
сводится к проблеме определения интеллекта вообще: является ли он 
чем-то единым, или же этот термин объединяет набор разрозненных способно- 
стей? В какой мере интеллект можно создать, а в какой он существует априори? 
Что именно происходит при таком создании? Что такое творчество? Что такое 
интуиция? Можно ли судить о наличии интеллекта только по наблюдаемому 
поведению, или же требуется свидетельство наличия некоего скрытого меха- 
низма? Как представляются знания в нервных тканях живых существ, и как 
можно применить это в проектировании интеллектуальных устройств? Что та- 
кое самоанализ и как он связан с разумностью? И более того, необходимо ли 
создавать интеллектуальную компьютерную программу по образу и подобию 
человеческого разума, или же достаточно строго «инженерного» подхода? Воз- 
можно ли вообще достичь разумности посредством компьютерной техники, или 
же сущность интеллекта требует богатства чувств и опыта, присущего 
лишь биологическим существам? На эти вопросы ответа пока не найдено, 
но все они помогли сформировать задачи и методологию, составляющие основу 
современного ИИ. Отчасти привлекательность искусственного интеллекта в том 
и состоит, что он является оригинальным и мощным орудием для исследования 
именно этих проблем. ИИ предоставляет средство и испытательную модель для 
теорий интеллекта: такие теории могут быть переформулированы на языке 
компьютерных программ, а затем испытаны при их выполнении. По этим причи- 
нам наше первоначальное определение, очевидно, не дает однозначной характе- 
ристики для этой области науки. Оно лишь ставит новые вопросы и открывает 
парадоксы в области, одной из главных задач которой является поиск 
самоопределения. Однако проблема поиска точного определения ИИ вполне 
объяснима. Изучение искусственного интеллекта — еще молодая дисциплина, и ее 
структура, круг вопросов и методики не так четко определены, как в более зрелых 
науках, например физике. .. Из-за специфики проблем и целей искусственный 
интеллект не поддается простому определению» (Выделено нами. — А. Ж.). 


Со многими положениями этого определения нельзя не согласиться. Но 
остается впечатление некоторого ухода от ответа по существу и растворение 
проблемы в круге связанных с нею пограничных вопросов. Если определение 
некоторого понятия носит «скользящий» характер, то это является признаком 
того, что такое определение либо внутренне противоречиво, либо основано 
не на существенных признаках определяемого понятия. Нам представляется, 
что имеются причины, по которым определение искусственного интеллекта, 
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«проскальзывает». Прежде чем конкретизировать эти причины, обратим вни- 
мание на следующее. По нашему мнению, те системы ИИ, которые все с нетер- 
пением ожидают увидеть, те системы ИИ, которые создаются разработчиками, 
и те системы ИИ, которые следовало бы признавать таковыми, — это совер- 
шенно разные объекты. Поэтому определения, желания и реальность не схо- 
дятся и ускользают из рук. Как если бы, мечтая о птице, мы вслух утверждали, 
что хотим иметь пароход, но при этом упорно строили автомобиль, и все 
это называли бы одним термином, удивляясь, почему результат не приносит 
удовлетворения. Термином «искусственный интеллект» мы называем объекты, 
которые принципиально не могут демонстрировать тех свойств, которые мы 
интуитивно ждем от объектов с таким названием, а те системы, которые могли 
бы демонстрировать эти интуитивно ожидаемые свойства, нам не интересны, 
потому что они еще не развиты и дают не очень выразительные результаты. 

Ситуацию можно образно прояснить такой картинкой. Интеллект человека 
(это пока единственный образец интеллекта, с существованием которого со- 
гласны все) можно представить в виде высокой пирамиды, которую образуют 
следующие элементы. 


а) Большая и сложная нервная система и мозг, причем их форма явно 
отражает очень продолжительную их эволюцию во времени, начавшу- 
юся когда-то с простейших живых форм и прошедшую многие фазы 
эволюционирующих видов, выживших в естественном отборе. В составе 
и структуре нервной системы и мозга можно наблюдать определенные 
архаические образования, возникшие и работавшие некогда и затем 
потерявшие свою актуальность, но, тем не менее, влияющие на работу 
нервной системы в ее современном виде, в том числе — на ее интеллек- 
туальные проявления. 

6) Бесчисленные результаты очень долговременной специализации всего, 
что только имеет отношение к нервной системе и ее деятельности 
в конкретных условиях земного существования человека — отточенные 
по всем параметрам датчики, нервные клетки, сети из этих клеток, 
конструкции и подсистемы мозга, актуаторы и т. д. 

в) Большой набор запрограммированных видов «репертуарного» поведе- 
ния, закрепленного уже «аппаратно» (при этом доля репертуарного 
поведения в составе поведенческих актов трудно определяется, но, пред- 
положительно, очень велика). 

г) Немыслимо большой опыт жизни в конкретных условиях, записанный 
в памяти человека, в том числе на генном уровне, развивающийся 
на своем собственном содержимом, где новое (образы, эмоциональные 
оценки, действия, программы и характер поведения) логически следует 
из старого. 

д) Очень сильное влияние не только рациональной информации в прошлом, 
но и случайной информации, которую невозможно отделить в настоя- 
щем, настолько глубокие корни она пустила во все поры нашего интел- 
лекта. 
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е) Огромное число задач, которые должна была решать нервная система, 
чтобы управлять телом и поведением человека, дошедшего до наших 
дней, выигравшего в борьбе за существование во враждебном окруже- 
нии. Это задачи типа поддержания состояния внутренней среды орга- 
низма, управления движениями тела, навигация в пространстве, управ- 
ление поведением в среде, постановка целей, выбор стратегии достиже- 
ния цели, общение в популяции и т. п. Разве это не «интеллектуальные» 
задачи? 

ж) А также другие факторы, каждый из которых так же нельзя удалить 
из этой пирамиды, как нельзя вытащить камень из каменной пирамиды. 


И вот где-то на самой вершине этой пирамиды, в ее последнем тонком 
и узком слое и в самые последние мгновения эволюции человека (какие-то 
последние несколько тысяч лет из многомиллионолетней его эволюции из пон- 
гидов) некоторые, далеко не все, люди начали демонстрировать умение решать 
специфические задачи типа математического счета, игр и некоторых других. 
Мы ухватились за этот относительно тонкий слой в огромном спектре функци- 
ональных свойств нервной системы, проявляющийся даже не у всех, а только 
у некоторых людей, почему-то выделили его в некое отдельное явление — 
интеллект и хотим построить систему, которая будет демонстрировать только 
подобные умения, не решая при этом всех задач, составивших и поддерживал 
ющих всю пирамиду интеллекта нервной системы. Это примерно такая же за- 
дача, как искусственно построить листочек на вершине дерева, не построив его 
кроны, ствола, и веток, корневой системы, био- и экологической среды, избежав 
проблем эволюции. Можно на искусственной подпорке поставить один листо- 
чек интеллекта, который будет играть в шахматы, а на другой подпорке — 
листочек, который будет формально переводить с одного языка на другой. Но 
эти листочки, во-первых, будут построены совершенно по-разному, они никак 
не могут составить кроны одного дерева, во-вторых, будут не так, как человек, 
играть в шахматы, и не так, как человек, переводить тексты, и тем более не 
смогут решать все эти задачи одновременно. 

Собственно, почему мы решили, что так называемые интеллектуальные 
проявления человека — это задачи более сложные, чем остальные задачи 
из широкого спектра задач, решаемых нервной системой? Можно ли утвер- 
ждать, что игра в шахматы это более интеллектуальная задача, чем управ- 
ление процессом ходьбы живого организма (попробуйте оценить сложность 
задач, решаемых нервной системой гимнаста, выполняющего свою спортивную 
программу), или задача управления полетом птицы? Задача, игры в шахматы 
в принципе решается методом перебора. А для того, чтобы обеспечить ходьбу 
или полет организма, его нервной системе надо решать такие задачи, как: 
распознавание образов, задача принятия решений, постановка цели, выбор 
траектории и т. д. Все эти задачи надо решать строго согласованно и в строго 
реальном времени. И кроме того, все эти задачи решаются нервной системой 
в режиме самообучения. А это на порядок увеличивает сложность задач. Нерв- 
ной системе приходится учиться в условиях, когда организм растет, меняются 
его параметры и динамические свойства. Меняются свойства окружающей 
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среды. Умение решать только некоторые из этих задач в искусственных систе- 
мах относится к задачам искусственного интеллекта. Например, современную 
систему распознавания, умеющую распознавать лицо человека, мы относим 
к системам ИИ очень высокой пробы, но домашней собачке, распознающей 
лица людей гораздо лучше, а заодно решающей и тысячу других задач, мы 
отказываем в «интеллекте». 

Поэтому мы видим два пути в работе над искусственными интеллекту- 
альными системами. Первый путь — это добиваться понимания того, как 
работает интеллект живых организмов, и строить модели этих объектов. Здесь 
более правильной будет не модель верхнего кирпичика большой пирамиды 
естественной нервной системы, без собственно самой пирамиды, а модель пусть 
маленькой, но цельной пирамиды — нервной системы со всеми ее основными 
свойствами. Пусть эта модель не в шахматы играет, а демонстрирует спо- 
соб саморазвития, умение обеспечивать свое выживание, умение обучаться, 
умение управлять и приспосабливать свое поведение к изменяющимся свой- 
ствам пусть простой среды, умение формировать образы, прогнозировать, 
принимать обоснованные решения, развиваться. Всех достижений современной 
науки пока недостаточно для того, чтобы построить объект, подобный не 
то что интеллекту человека, кошки, или даже мышки, но даже интеллекту 
муравья. При всей мощи наших «систем искусственного интеллекта». Поэтому 
на этом пути следует, прежде всего, признать, что коль скоро задачи типа 
распознавания и принятия решений мы относим к задачам ИИ, а муравей 
решает эти задачи лучше наших систем ИИ, то муравей обладает интеллектом, 
т.е. следует признать, что интеллектом обладают все живые существа, 
по крайней мере имеющие нервные системы, демонстрирующие самообуча- 
ющееся поведение. Потому что для обеспечения самообучающегося поведения 
требуется решать весь комплекс рассмотренных выше задач — обучение без 
учителя, обучение с учителем, распознавание образов, представление знаний, 
прогнозирование, планирование и принятие решений и т. д. Умение играть 
в шахматы — это не более чем гипертрофированно развитое умение решать 
некоторые из задач, решаемых любым живым организмом — распознавание 
ситуации, моделирование альтернативных вариантов, их качественное оце- 
нивание, прогнозирование, принятие решения. При этом, несмотря на то, 
что, придумывая игры, люди представляют в них сильно рафинированные, 
формализованные и упрощенные жизненные ситуации, что позволяет строить 
формальные исполнители (программы), способные играть в эти игры, все же 
человек, играя, например, в шахматы, в отличие от компьютера, задействует 
очень глубокие пласты многовекового опыта своих предков, решавших задачи 
обороны и нападения, тактики и стратегии, оценивания противника, оценивал 
ния ситуации. Человек, играя в шахматы (как и в другие игры), использует 
огромное количество аналогий, которые он находит в глубинах своей памяти, 
отражающей культуру человечества, например опыт психологической борьбы 
с противниками, опыт психологической самоорганизации, опыт прогнозиро- 
вания в самых разных сферах, отражаемый в интуиции, и другие свойства 
своей биологической пирамиды жизни. Напомним еще о нерациональных 
с современной точки зрения действиях людей, готовящихся к сражению — 
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гаданиям, жертвоприношениям богам, молитвам. Не исключено, что подобные 
действия совершают и некоторые шахматисты перед ответственной игрой. 
Если мы построим искусственного муравья, который эволюционно разовьется 
до уровня, сравнимого с человеком, и если он научится играть в шахматы 
и захочет играть в них, то вот это и будет правильная интеллектуальная 
шахматная программа, которую можно будет сравнивать с человеком. С этой 
точки зрения специализированный суперкомпьютер, который переигрывает 
шахматного чемпиона, используя ббльшую емкость памяти и быстрый пе- 
ресчет большего числа вариантов ходов, чем это может сделать человек, — 
не представляет особого интереса как система ИИ. Это сугубо инженерное 
решение, узкоспециализированная машина, не имеющая никакого отношения 
к проблеме моделирования естественного интеллекта. Ее «интеллект» можно 
сравнивать с интеллектом человека на тех же основаниях, на которых можно 
сравнивать передвижение человека, идущего пешком, с движением автомо- 
биля. Пусть современные автомобили разгоняются до больших скоростей, 
намного превосходящих скорость движения пешего человека, но даже в самых 
современных роботах не удается смоделировать ходьбу человека ни в отноше- 
нии ее скорости, ни в отношении ее свойств. И более того, известные эффектно 
выглядящие антропоморфные шагающие роботы шагают совсем не по тем 
принципам, по которым шагает человек, и потому их прогресс в умении ходить 
отнюдь нельзя сравнивать с развитием процесса ходьбы от обезьяны к чело- 
веку. Современные роботы ходят только благодаря точной математической 
модели процесса ходьбы, а не в результате самообучения. Если математиче- 
ская модель требует, чтобы вертикальная проекция центра тяжести всегда 
пересекала площадь опоры робота, то робот так и будет ходить всю жизнь 
«деревянными» шагами, аккуратно выполняя программу и падая при любой 
заранее не предусмотренной в программе ситуации. Развитие в его ходьбе бу- 
дет связано только с развитием математической модели этого процесса. Более 
адекватной системой управления ходьбой на этом пути развития ИИ могли 
бы быть программы, обеспечивающие самообучение шагающего механизма, 
с его адаптацией к закономерным свойствам приводов, робота, среды и т. д., 
где проглядывалось бы присутствие случайного поведения, обеспечивающего 
реализацию метода проб и ошибок, поискового механизма обучения. 

Второй путь состоит в построении машин, программ, которые решают 
отдельные задачи из репертуара естественного интеллекта с сугубо прагма- 
тическими целями. Преимущественно эти системы сейчас и называют систе- 
мами ИИ. Поскольку каждая из таких отдельно взятых задач вполне может 
быть решена технически, то можно констатировать, что такие системы ИИ 
давным-давно построены и не только успешно функционируют, но и по многим 
параметрам давно превосходят человека. Можно долго перечислять отдельные 
задачи, выдернутые из репертуара естественных нервных систем и успешно 
решенных различными техническими средствами. Обычный карманный каль- 
кулятор является совершенной системой ИИ, поскольку он умеет решать 
задачи, которые не только раньше, но и сегодня далеко не все люди решать 
умеют — суммировать, умножать, делить, вычислять проценты и т. д. Кроме 
того, карманный калькулятор давно обошел человека по таким параметрам, 
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как быстродействие, точность вычисления и некоторым другим. Если сей- 
час кто-то может выразить сомнение в том, что карманный калькулятор 
является ИИ, то еще в ХІХ веке такой калькулятор, безусловно, был бы 
признан не только искусственным интеллектом, но и чудом. Если говорить 
о современных компьютерах, программах и системах, давно обогнавших че- 
ловека по скорости счета, точности, трудоемкости, надежности, и другим 
параметрам при решении отдельных задач, то они имеют полное право име- 
новаться прагматическими системами ИИ. В этом мы абсолютно согласны 
с Кевином Уорвиком [31]. И если мы все же не хотим называть их искус- 
ственным интеллектом, то именно потому, что они очень далеки от свойств 
естественной нервной системы. Мы не хотим признавать их «настоящим ИИ» 
и правильно делаем, потому, что эти системы построены не на тех принципах, 
по которым работают нервные системы. И сложностью решения отдельных 
прагматических задач этот факт не отменить. Думается, что даже нагромож- 
дение таких прагматических систем в одном «интеллектуальном монстре» все 
равно не даст желаемого эффекта живого интеллекта. При этом поведение 
какого-нибудь двухмесячного щенка будет радовать нас проявлением живого 
интеллекта. Причина состоит в том, что и любое нагромождение прагматиче- 
ских систем ИИ будет ни чем иным, как только имитацией верхнего кирпичика 
пирамиды, стоящего на подпорках при отсутствии самой пирамиды. Что-то 
вроде головы без туловища. 

Здесь хотелось бы еще подчеркнуть тот факт, что прагматической си- 
стемой ИИ может называться не только техническая система, управляемая 
компьютером, перерабатывающим информацию средствами электроники. Об- 
рабатывать информацию и принимать управляющие решения можно и дру- 
гими техническими средствами. Механический арифмометр, часовой меха- 
низм, гидравлические и механические машины тоже призваны решать зал 
дачу преобразования входной информации в выходную и преобразовывать ее 
в управляющие воздействия. Если, например, лошадь бежит по кругу, то ее 
нервная система решает комплекс интеллектуальных задач: распознавание, 
постановка цели, выбор плана достижения цели, принятие решения, сравнение 
прогноза с действительностью, коррекция движения и др. Если вы заставили 
вагонетку ездить по кругу по рельсам, то это означает, что ваша машина тем 
или иным способом решает те же задачи. Список задач идет от характера 
конечного результата. Здесь не всегда просто понять, какая именно часть 
машины решает ту или иную интеллектуальную задачу. Например, в данном 
случае задачу распознавания образа текущего положения объекта управления 
решают такие «датчики», как рельсы. По силе давления на его боковую 
поверхность реборды колеса вагонетки рельс «понимает» рассогласование дей- 
ствительного и желаемого движения объекта. Если рассогласование больше 
некоторого порога, выраженного силами трения колеса о рельс и давления, 
то рельс «принимает решение» надавить на реборду с силой, направление 
которой соответствует геометрии контактирующей пары рельса и реборды, и с 
величиной, заданной определенным «законом управления», зафиксированным 
в определенной жесткости материалов рельса и реборды. В этой управляющей 
системе предусмотрены и другие обратные связи (выраженные, например, 
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в законах «противодействие должно быть равно действию» и т. п.), регули- 
рующие процесс управления, в том числе — при разных значениях парамет- 
ров. Следовательно, вагонетка, едущая строго по кругу, согласно некоторому 
заранее заданному плану, тоже может быть названа системой ИИ. Если же 
что-то происходит без заранее составленного плана и без специализированного 
механизма, обеспечивающего выполнение этого плана, то здесь интеллект 
не проявляется. 

Итак, рассмотрим возможности определения искусственных систем, кото- 
рые проявляют интеллектуальные свойства с помощью тех понятий, которые 
мы рассмотрели выше в данной книге. Попробуем определить те признаки, 
которым должна удовлетворять искусственная система, представляющая со- 
бой ту маленькую пирамиду интеллекта, которая может вырасти в большую 
пирамиду, и признаки, которые отличают ее от модели верхнего кирпичика 
такой пирамиды, стоящего на подпорках, заменяющих пирамиду. 


5.2. Естественное управление 


Вся предыдущая часть книги может рассматриваться как обоснование того 
убеждения, что естественные системы управления должны обладать опреде- 
ленным набором свойств, которые будем называть принципами естественного 
управления. 


1. Естественные системы управления автономны, т. е. они являются встро- 
енными подсистемами своих объектов управления. 


2. У естественных систем управления должны быть две целевые функции: 
а) выживание и б) накопление знаний. Будем называть их целевыми функци- 
ями естественного управления. 


3. Естественные системы управления должны иметь аппарат эмоций, явля- 
ющийся универсальной «движущей силой» внутренней активности организма, 
«учителем» и системообразующим фактором, инициирующим, организующим, 
направляющим и регулирующим работу организма. Аппарат эмоций должен 
быть устроен так, что универсальная «потребность» организма в получении 
положительных эмоциональных оценок и в избежании отрицательных оценок 
косвенно обеспечивала бы движение организма к названным целевым функ- 
циям выживания и накопления знаний. 


4. Естественные системы управления должны быть к моменту начала, авто- 
номного управления (к моменту рождения их «подшефного» организма) мак- 
симально приспособлены к условиям жизни в их среде обитания в соответствии 
со средними условиями жизни их предков. Начальная приспособленность 
должна касаться не только всего их «һагамаге», фенотипа, но и общих для 
данного биологического вида информационных объектов — образов, действий, 
эмоциональных оценок, знаний, программ и тактик поведения в их готовом, 
сформированном виде либо в виде готовых правил для автоматического их 
формирования самим индивидом. 
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5. Естественные системы управления индивидов должны быть способны 
к формированию новых информационных объектов — образов, действий, 
эмоциональных оценок, знаний, программ и тактик поведения, отражающих 
закономерности в конкретной системе «среда — индивид — нервная система» 
в соответствии с теми правилами, которые были заложены в индивидах. 


6. Формирование новых информационных объектов в индивиде должно 
происходить на материале не только текущей наблюдаемой информации, но 
и на основе информации о предыстории жизни данного индивида, отраженной 
в его памяти. 


7. Естественные системы управления должны иметь память для записи 
информации об истории жизни и эволюции индивида. Способ представления 
данных в этой памяти должен осуществлять постоянное агрегирование, сжатие 
информации. 


8. Естественные системы управления постоянно осуществляют поиск зако- 
номерностей (знаний) в содержимом памяти своей предыстории. Этот поиск 
производится имеющимися у данного организма и индивида формальными 
средствами, которые не могут гарантировать ни обнаружения всех имеющихся 
закономерностей, ни отсутствия ошибок и ложных результатов, что отража- 
ется на поведении индивида. 


9. Естественные системы управления должны иметь память для представ- 
ления результатов извлечения знаний. Содержимое этой памяти знаний также 
подвергается постоянному анализу с целью выявления знаний над знаниями. 


10. Из целевых функций естественных систем управления и условий суще- 
ствования организма следует, что естественные системы управления должны 
взаимосогласованно решать определенный набор задач, а именно: автомати- 
ческая кластеризация входных сигналов датчиков, представление сформи- 
рованных образов в памяти образов, распознавание образов, эмоциональное 
оценивание текущей ситуации и сформированных образов, анализ альтерна- 
тивных вариантов поведения, прогнозирование, оценивание альтернативных 
вариантов, принятие решений, формирование новых знаний на эмпирическом 
материале, формальный вывод новых знаний и некоторые другие задачи. 


11. Из логических взаимосвязей перечисленных задач следует, что есте- 
ственные системы управления должны иметь определенный состав подсистем 
и структуру, которые представлены на рис. 5.1. 


12. Естественные системы управления должны быть саморазвиваемыми, 
постепенно усложнять состав и структуру своих информационных объек- 
тов — образов, действий, эмоциональных оценок и знаний, что отражается 
в их постепенном приспособлении к условиям конкретного существования и в 
повышении целесообразности их поведения с точки зрения их выживания 
и накопления знаний. 


Поскольку задачи, которые приходится решать каждой естественной си- 
стеме управления и перечисленные в п. 10, являются сложными задачами, 
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Рис. 5.1. Состав и структура естественной автономной системы управления 


относимыми сегодня в компьютерных науках к задачам «искусственного ин- 
теллекта», то приходится признать, что каждый живой организм обладает 
естественным, интеллектом. 

Если мы хотим построить модель естественной системы управления, то все 
сказанное должно относиться и к такой модели. Все живые организмы де- 
монстрируют свойства естественного управления. Но искусственные объекты 
и системы управления далеко не всегда, а точнее, почти никогда не демон- 
стрируют всех свойств естественного управления одновременно. Попробуем 
ответить на вопрос, почему так происходит. 
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Прежде всего, свойства естественного управления тесно связаны с тем, что 
управляющая система является автономной, т. е. встроена в объект управле- 
ния, и управляет на основе своих решений, основанных на саморазвивающихся 
знаниях. И то, и другое обусловлено тем, что нервная система организма 
не только находится в заточении «в темнице», отгороженной от мира име- 
ющимися у организма сенсорами и актуаторами, а потому имеющая возмож- 
ность получать информацию только через эти сенсоры, но еще и потому, что 
нервная система, вместе со своей «темницей» родилась и развивалась вместе 
с организмом из одной клетки. Даже если вы захотите вложить в нервную 
систему развитые готовые знания, то у вас нет для этого иных средств, кроме 
проталкивания этих знаний через штатные каналы нервной системы — через 
ее сенсоры и систему распознавания, которая относится к вашей многоценной 
информации точно так же, как и к любой другой, например как к шуму ветра. 
О сложности этой задачи бескорыстной передачи готовых знаний говорит 
мучительный опыт педагогики, свидетельствующий, что не очень-то стремится 
нервная система ребенка, вбирать в себя чужие знания, даже с помощью кнута 
и пряника. Ей приятнее играть и гулять, добывая новые знания во дворе 
самостоятельно и на своем опыте. 

Если говорить о современных системах управления, используемых в тех- 
нике, то они все еще не отвечают тем или иным, а иногда и всем вместе 
названным принципам естественного управления. 


® Либо они не встроены в объект управления, а находятся в каком-нибудь 
Центре управления полетом, окруженные толпой экспертов со справоч- 
никами под мышкой (не выполняется условие 1), либо они встроены 
в объект управления (Луноход, Рабййп4ег), но не автономны — получают 
квалифицированную помощь из тех же Центров управления. 

® Целевая функция выживания выполняется обычно в том смысле, что 
управляющая система должна обеспечить выживание людей, а не соб- 
ственно объекта управления. Есть разница между оседланной лошадью, 
старающейся в первую очередь обеспечить свое выживание, а во вторую 
очередь — всадника, и системой безопасности автомобиля, который 
специально сминается при ударе так, чтобы максимально сохранить пас- 
сажиров (здесь не выполняется условие 2, а). Если устройство автома- 
тическое, то в некоторых случаях условие 2, а выполняется, устройство 
«заботится» о своем выживании. Хотя и в этом случае оно работает 
в первую очередь во благо человека, а не себя. Большинство систем 
управления являются не самообучаемыми (не выполняется условие 2, б). 
Если управляющая система самообучаемая, то условие 2,6 выполняется. 

® Аппарат эмоций в действующих системах управления редуцирован до 
указания целевого состояния параметров и вычисления рассогласования 
текущих и целевых значений, которое и минимизируется. В большин- 
стве случаев это только отрицательная обратная связь, обеспечивающая 
реактивное управление. Иногда используется и положительная обрат- 
ная связь. Но в явном виде аппарат эмоций пока не используется. 
Принципиальная важность роли, которую этот аппарат играет в живых 
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организмах, как правило, не осознается, и эмоции не воспроизводятся 
в технических системах. Общепринятым является упрощенное понима- 
ние аппарата, эмоций как экрана, отображающего настроение человека, 
без осознания центральной роли эмоций в автономном управлении и обу- 
чении, а также его коммуникационной роли (условие 3 не выполняется 
или выполняется частично). 

Условие 4 выполняется обычно очень хорошо, поскольку выполнением 
именно этого условия и подменяется в современной технике не реа- 
лизуемая пока еще возможность объекта управления автоматически 
приспосабливаться к изменяющимся обстоятельствам. Параметры ис- 
кусственного устройства еще на этапе проектирования выбираются та- 
кими, чтобы они максимально подошли в будущем к усредненной модели 
предполагаемых обстоятельств. Например, размеры кресел в автомобиле 
рассчитываются с учетом среднестатистических размеров человека. Пал 
раметры подвески автомобиля рассчитываются, исходя из среднестати- 
стических характеристик дорог тех регионов, для которых предназначен 
автомобиль этой модели, и ожидаемых условий его эксплуатации (вес 
пассажиров и грузов, характер движения и т. д.). Иногда предлагаются 
две-три опции, которые можно выбрать в качестве «адаптации» к кон- 
кретным условиям (угол наклона и сдвиг кресла, жесткий и мягкий 
режим работы подвески и т. п.). Устройства еще лишены возможности 
автоматически приспосабливаться к конкретным условиям. 

Условия 5, б если и выполняются, то только у самообучаемых систем — 
например, в самообучаемых системах распознавания. 

Можно видеть выполнение условия 7 в таких системах, как охранные 
системы наблюдения, системы мониторинга или экспериментальные на- 
учные установки, где наблюдательные данные сохраняются в архивах 
на специальных носителях. Но, как правило, исходные данные также со- 
храняются, несмотря на последующую их обработку и извлечение из них 
новых сжатых данных (знаний), которые обобщаются, анализируются 
и описываются в отчетах, публикациях и т. п. В живом организме нет 
возможности хранить архивы исходных наблюдательных данных, там 
процесс сжатия данных должен быть автоматизирован. 

Поиск закономерностей (условия 8, 9) в содержимом памяти своей 
предыстории производится во многих искусственных системах, в частно- 
сти в научных экспериментах. Например, в накопленных астрофизиками 
данных по радиоизлучению от космических источников отыскиваются 
периодические компоненты методами спектрального анализа. Здесь 
формальным средством отыскания закономерности служит, например, 
Фурье-анализ, использующий гармоники в качестве базиса — правила 
для поиска закономерности. Можно использовать другие базисы, другие 
правила, описывающие, какого вида закономерности мы хотим найти. 
Но такой базис обязательно должен быть указан. 

В современных технических системах условия 9, 10, как правило, не вы- 
полняются. На практике системы управления решают только некоторые 
из указанных задач. Это связано с тем, что в полной автономной системе 
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управления, которая должна иметь весь определенный набор подси- 
стем, замкнутых в цикл (рис. 5.1), можно в различных частных слу- 
чаях убрать одну или несколько подсистем, заменив их «заглушками». 
Например, если можно построить такую систему управления, которая 
будет совершать одно из Г, действий, в зависимости от того, какая из Г, 
ситуаций будет распознана, то систему управления можно построить 
только из подсистемы распознавания образов с алфавитом классов из Г 
образов и исполняющего устройства, которое будет реализовывать одно 
из Г, заранее известных действий. Все остальные подсистемы можно 
убрать. Если для управления достаточно только воспроизводить знания 
эксперта, зафиксированные в памяти компьютера, то можно использо- 
вать только датчики, Базу Знаний, в которую заранее записаны знания 
эксперта (экспертную систему), и исполняющие устройства и т. д. 

® Нам неизвестны автоматические системы, демонстрирующие свой- 
ство 12. Есть имитации таких систем. Например, японский робот-собака, 
Ао имитирует развитие собаки с помощью заранее записанных в па- 
мять программ, соответствующих разным уровням обученности собаки, 
и постепенного ввода этих программ в действие. Это, безусловно, ими- 
тация развития, а не настоящее развитие. Хотя в Афо существуют 
и определенные адаптивные функции. 


5.3. Автономный интеллект и подчиненный интеллект 


Поскольку мы выяснили, что системы, реализующие принципы естественного 
управления, проявляют тем самым интеллект, то, следовательно, искусствен- 
ные системы, демонстрирующие принципы естественного управления, явля- 
ются интеллектуальными системами. Поскольку термин «системы ИИ» уже 
занят сегодня, то разберемся, к каким системам в нашей классификации 
следует отнести современные системы ИИ. 

Самым распространенным отличием систем ИИ от систем, реализующих 
принципы естественного управления, является их неавтономность, которая 
состоит в том, что их УС не является подсистемой ОУ, т.е. вся УС или 
ее часть находятся за пределами ОУ. Но это положение легко исправить, 
надо лишь расширить границы рассматриваемого ОУ как части среды, до 
тех пор, пока вся УС не будет включена внутрь такого ОУ. Тогда начнет 
выполняться условие 1. Например, если человек дистанционно управляет 
некоторым механизмом, имеющим датчики и исполнители, то автономным 
объектом управления можно считать пару человек-механизм, и управляющая 
система старается обеспечить выживание этого объекта в целом. Сам механизм 
здесь неавтономен. 


Аксиома. Всякий объект управления является не более чем подсисте- 
мой некоторого автономного обоекта управления, главной целью управления 
которого является сохранение его тождества. 
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Вспомним, что при рассмотрении вопроса о критериях тождественности 
объектов (гл. 2) мы пришли к выводу, что тождественность живого организма 
должна определяться через преемственность его знаний. Сформулируем кри- 
терий тождества автономного объекта управления: 


Объект управления А1 в момент # тождествен объекту управления В2 в мо- 
мент іг, > 1, если База Знаний (память) объекта управления В2 по состо- 
янию на момент Ёо есть развитие той Базы Знаний объекта управления Вл, 
которая у него была в момент Н. Под развитием здесь понимается наполнение 
Базы Знаний новой информацией в процессе управления, осуществляемого 
с помощью этой же Базы Знаний, и допускается определенный уровень потерь 
информации в памяти. 


Главное суждение этого критерия состоит в том, что тождество автоном- 
ного объекта управления определяется через преемственность Базы Знаний 
его управляющей системы. При этом преемственность понимается только как 
наполнение Базы Знаний в процессе непрерывного управления с помощью 
этой же Базы Знаний. Это требование обеспечивает логическую и собы- 
тийную непрерывность каждого последовательного состояния Базы Знаний. 
Отсюда следует, что автономный объект управления тождествен себе, пока его 
управляющая система пользуется при управлении одной развивающейся Базой 
Знаний, и этот объект управления не был и/или перестает быть таковым, когда 
он не управляется Базой Знаний или управление передается управляющей 
системе с Базой Знаний, имеющей другую предысторию. Заметим также, что 
предыстория Базы Знаний тесно связана со свойствами и обстоятельствами 
конкретного объекта управления, его элементов и связей, потому что База 
Знаний, являющаяся подсистемой управляющей системы, приспосабливается 
к среде за пределами управляющей системы, но исполняющие устройства, 
и датчики являются элементами этой среды. 

Названный критерий косвенно регламентирует и определенную преем- 
ственность «тела» объекта управления, а не только информации Базы Знаний, 
поскольку База Знаний является подсистемой управляющей системы, а та 
в свою очередь является подсистемой объекта управления, т. е. управляющая 
система тесно связана с конкретными элементами объекта управления. Если 
окружающая среда, исполняющие органы и/или датчики изменяются со вре- 
менем, то База Знаний адаптируется к новой среде, но информация о старой 
среде остается в Базе Знаний. 

Отдельно следует рассматривать вопрос о возможности и способе тести- 
рования объекта управления на его соответствие критерию тождества. Если 
единственная возможность такого тестирования связана с изучением функ- 
ционирования объекта управления, на которое отображается БЗ, то функ- 
ционирование тестируемого объекта, управления надо сравнивать с функци- 
онированием тестирующего объекта управления, отображающим свою Базу 
Знаний. Результаты такого тестирования могут быть во многом неоднознач- 
ными. Принципы взаимодействия двух ОУ будут рассмотрены ниже, однако 
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здесь скажем, что о тождестве объекта управления, которое может быть 
установлено при тестировании другим объектом управления, можно говорить 
только при конкретном определении: что представляют собой управляющая 
система, исполняющие органы, датчики и Базы Знаний в каждом из этих 
объектов управления и чем формализуется их взаимодействие. Другими сло- 
вами, должно быть принято соглашение о наборе датчиков для проведения 
испытаний, о словаре символов для записи протокола результатов испытаний, 
и об алгоритме тестирования. Смена БЗ в любом из объектов управления 
и/или изменения в управляющей системе, исполнителях или датчиках или 
во взаимодействии этих объектов управления может привести к заключению 
о том, что тождественность объекта управления А не выполняется. Например, 
такие ситуации возникают при установлении личности задержанного человека. 


Определение 1. Автономным интеллектом (АИ) или собственно интеллек- 
том является способность автономного объекта принимать решения, соответ- 
ствующие целевым функциям естественного управления. При этом решения 
принимаются на основе оцененной Базы Знаний, аппарата эмоций и эмоци- 
ональных оценок, сложившихся в предыстории данного объекта управления 
и активизированных в текущий момент. 


Согласно концепции ААУ, функционирование управляющей системы при 
естественном управлении направлено на наполнение БЗ новой информацией, 
начиная с любого ее минимального количества и на основе имеющейся на- 
чальной информации. Поэтому говорим, что АИ состоит из соответствующей 
функциональной «оболочки» с любым количеством информации. 


Определение 2. Автономным искусственным интеллектом (АИИ) назовем 
искусственный объект управления, удовлетворяющий определению АИ. 


На наш взгляд, очень важное значение для интеллекта имеет наличие 
языка. Для того чтобы ввести язык в определение интеллекта, еще раз вер- 
немся к уже использовавшемуся рисунку (рис. 5.2). Пусть объект управления 
на рис. 5.2 обладает АИ. Взаимодействие объекта управления с окружающей 
его средой исчерпывается следующими циклическими процессами: 


а)... а с->...; 
6)... а: —>а—>й-...; 
в)... а 1 > амф -ар>й 


Процесс (а) не включает маршрут а, реализуемый управляющей системой, 
поэтому он не связан с АИ непосредственно и представляет объект управления 
как простую неуправляемую подсистему. Процесс (а) можно назвать неуправ- 
ляемым взаимодействием. Он не связан с интеллектом. 

Процесс (6) включает маршрут а и связан с АИ. Этот процесс можно 
назвать управляемым, взаимодействием, (УВ). Это реактивный процесс, если 
он порожден внешней средой, хотя он может быть и активным, если порожден 
истоком внутри управляющей системы (например, аппаратом эмоций) или 
самим объектом управления (срабатывание датчика внутри «тела» объекта 
управления, непроизвольное сокращение мышц и т. п.). Основная особенность 
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Рис. 5.2. Петли положительных обратных связей, обусловливающие способность 
прогнозирования при принятии решений, определяют возможности появления ин- 
теллекта в системе управления 


этого процесса, — это его непосредственная, без «обдумывания», рефлекторная, 
обусловленная также памятью, реакция на входной стимул. 


Определение 3. Если АИ осуществляет УВ, то назовем его автономным 
интеллектом 1-го рода (АИТ). Искусственную реализацию АИ1 назовем ав- 
тономным искусственным ‘интеллектом 1-го рода (АИИ1). 


Конечно, в управляемом взаимодействии (УВ) используются знания и про- 
граммы поведения, закрепленные в Базе Знаний. Но они очень тесно связаны 
с реальной средой. Эти знания, реакции и программы запускаются только 
при наблюдении реальных объектов и ситуаций в среде. Например, реакция 
на некоторую опасность запускается только при реальном наблюдении этой 
опасности. Можно ли использовалъ такие знания для моделирования процессов 
в среде? Можно, но так, как это делают, например, животные в играх. Они 
моделируют реальную опасность непосредственной демонстрацией нападения 
друг на друга и т. п. 

Процесс (в) включает в себя цикл а — 6. Если организм обладает воз- 
можностью реализовывать такой цикл передачи информации, то это означает, 
что он может самостоятельно, без участия внешней среды возбуждать свою 
Базу Знаний, побуждая ее выдавать имеющиеся в ней реакции на те или иные 
ситуации. Такие акты фактически моделируют реальные процессы в среде, 
потому, что организм вызывает у своей Базы Знаний реакцию на события, 
которые реально в среде в это время не происходят. 

Назовем цикл а —> 6 моделированием, а процесс (в), содержащий в себе цикл 
моделирования, назовем ‘управляемым взаимодействием с моделированием 
(УВМ). Заметим, что разницу между процессами УВ и УВМ может увидеть 
только наблюдатель, находящийся за пределами объекта управления. С точки 
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зрения самой управляющей системы формальной разницы между процессами 
УВ и УВМ нет. Тем не менее, с точки зрения внешнего наблюдателя наличие 
у организма возможностей для УВМ существенно повышает интеллектуаль- 
ность последнего. 


Определение 4. Если АИ имеет возможность осуществлять процесс УВМ, 
то такой АИ назовем автономным интеллектом 2-го рода (АИ2), а его 
искусственную реализацию — автономным искусственным интеллектом 2-го 


рода (АИИ?). 


До сих пор в определениях, вводимых в этой главе (в частности, в опре- 
делениях 3 и 4), мы избегали использования понятия языка, которое было 
введено и описано ранее. Это сделано намеренно и затем, чтобы не исключать 
возможность того, что организм может осуществлять моделирование и без 
языка. Те же игры животных, демонстрация своим примером и т. п. суть 
способы передачи информации, которые кто-то, возможно, не захочет относить 
к языковым процессам. 


Определение 5. АИ, реализующий внешний язык, назовем автономным шн- 
теллектом. 3-го рода (ДИЗ), а его искусственную реализацию — автономным 
искусственным ‘интеллектом 3-го рода (АИИЗ). 


Примером АИЗ являются животные, которые оповещают друг друга об 
опасности с помощью определенных сообщений, составляющих специализиро- 
ванный внешний, понятный для животных этой популяции язык, например 
специальные крики, жесты. 


Определение 6. АИ, реализующий внутренний язык, назовем автономным 
интеллектом 4-го рода (АИА), а его искусственную реализацию — автоном- 
ным искусственным ‘интеллектом 4-го рода (АИИА). 


В качестве примера АИ4 надежно можно указать только на человека, 
поскольку наличие внутреннего языка у животных достоверно подтвердить 
мы не можем. Хотя с большой вероятностью он имеет место у высокоорга- 
низованных животных, судя по их способности принимать сложные решения, 
требующие многошагового планирования. 


Определение 7. АИ, реализующий взаимосвязанно внешний и внутренний 
языки, назовем автономным интеллектом 5-го рода (АИ5), а его искус- 
ственную реализацию — автономным искусственным интеллектом 5-го рода 


(АИИБ). 


Примером АЙЗ является человек, и возможно, некоторые высокоорганизо- 
ванные животные. 

Перейдем к рассмотрению неавтономных объектов управления. Если мы 
имеем дело со случаем, когда УС находится за пределами ОУ, то мы можем 
расширить понятие ОУ до того состояния, когда он вберет в себя УС. 

Все остальные случаи (подробнее см. [32]) мы можем с учетом дан- 
ной выше аксиомы свести к системе, состоящей из двух взаимодействую- 
щих ОУ (рис. 5.3). Согласно аксиоме, объединение этих двух ОУ должно 
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Рис. 5.3. Автономный искусственный интеллект может работать в паре с подчи- 
ненным искусственным интеллектом или быть образованным из нескольких систем 
управления 


обладать автономным интеллектом. Пусть ОУ! является неавтономным ОУ. 
В общем случае такой объект управления может обладать любым законом 
функционирования, при условии, что он компенсируется функционирова- 
нием ОУ» так, чтобы вся система сохраняла свойства АЙ. В этом случае будем 
говорить, что ОУ обладает более сильным ‘интеллектом, чем ОУ}, а ОУ! — 
более слабым интеллектом, чем ОУ». Однако собственно интеллектом они 
являются при объединении. В отдельности и тот, и другой могут собственно 
интеллектом не являться. 

В таком объединенном объекте управления с АИ, который образуется слия- 
нием нескольких объектов, можно выделить свой блок датчиков, свои исполни- 
тельные органы и свою объединенную управляющую систему. Потоки инфор- 
мации между отдельными составляющими этих подсистем могут идти не обя- 
зательно через «штатные» каналы, снабженные специализированными датчи- 
ками и актуаторами, но могут идти и через другие каналы, которые объектами 
управления воспринимаются как стоки и истоки. Например, если человек 
делает интеллектуального робота и может перепрограммировать его управ- 
ляющую систему или вносить какие-то данные в его Базу Знаний своими спо- 
собами, то для робота такое вмешательство воспринимается как работа истока. 


Определение 8. Пусть в паре ОУ! и ОУ», которая в целом имеет автономный 
интеллект, второй объект управления тоже имеет АИ, а ОУ! не имеет авто- 
номного интеллекта. Тогда назовем ОУ; подчиненным ‘интеллектом (ПИ). 
Искусственную реализацию ПИ назовем подчиненным искусствентњым интел- 
лектом (ПИИ). 
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Например, в паре человек—калькулятор в целом имеется автономный ин- 
теллект, и человек обладает АИ, но калькулятор, будучи интеллектуальной 
машинкой, обладает только подчиненным интеллектом, потому что не обла- 
дает автономным интеллектом, и более сильный АИ человека, его использует 
для достижения своих целевых функций естественного управления. 

Пока объединенный объект управления обладает АИ, каждый из входящих 
в него объектов управления может эпизодически и попеременно представлять 
собой АИ, ПИ или ни то, ни другое. Смена ролей объектов управления может 
быть обусловлена тем, что когда некоторый ОУ становится АИ, функциони- 
рование его партнера может противоречить целевым функциям естественного 
управления и потому подавляться более сильным интеллектом АИ. Когда 
же оба объекта управления являются АИ, между ними могут возникать 
конфликты, если достижению целевых функций естественного управления 
одним из них мешает достижение целевых функций естественного управления 
другого. Например, возникает борьба за ресурсы. 

В отличие от общепринятого на сегодня определения искусственного ин- 
теллекта, под которым понимается поведение некоторого объекта, разумное 
с точки зрения человека, определенные выше понятия АЙИ1-АИИ5 раскры- 
ваются не через восприятие человека. 

Рассмотрим отношение рассмотренных понятий и систем ИИ в их со- 
временном понимании. Представим систему ИИ как подсистему (некоторое 
устройство) в среде и рассмотрим ее возможные отношения с подсистемой АИ. 
Поскольку общепринятое понятие ИИ раскрывается через взаимодействие 
с человеком, то подходит схема (рис. 5.3), где ОУ} есть ИИ, а ОУ» есть человек, 
при этом положим, что ОУ» есть АИ. Тогда ОУ; есть ПИИ. Функции си- 
стемы ПИИ определятся ее положением относительно процессов и маршрутов, 
связанных с ОУ». Возьмем систему, представленную на рис. 5.2, где под ОУ 
будем понимать человека, обладающего АИИ, и будем помещать систему ПИИ 
на различные указанные маршруты (рис. 5.4). 

Возможны следующие случаи. 

Пусть система ПИИ принадлежит маршруту 4 (рис. 5.4). Возможно- 
сти ПИИ в этой схеме определяются свойствами современных компьютеров, 
на которых базируются сегодня системы ИИ. Это быстродействие, способность 
к логической обработке информации 


а ћ ә 42 ә аз > 44 — 1, 


где ПИИ подменяет или усиливает некоторые функции (быстродействие, ло- 
гику, память) человека для управления звеном 44. Примерами являются АСУ 
и экспертные системы. 

В этой же схеме (рис. 5.4) ПИИ используются в циклах а э ћ > а -—1 
для моделирования взаимодействия ОУ со средой. В ПИИ конструктивно 
закрепляется некий внешний язык, понятный ОУ (человеку), и эксплуати- 
руется быстродействие, логика и память ПИИ. Примерами являются СУБД, 
САПР, системы математического моделирования, игровые программы и т. п. 
Отсюда следуют направления развития ПИИ, которые очерчиваются стрем- 
лением к усовершенствованию внешнего языка (языки программирования, 
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Рис. 5.4. Автономный искусственный интеллект (АИИ), в данном случае связанный 

с объектом управления — человеком, может использовать систему подчиненного 

искусственного интеллекта (ПИИ) на разных участках своих связей с окружающей 
и внутренней средой 


операционные системы, интегрированные системы, системы представления 
данных, интерфейсы, оконечные устройства), а также памяти и быстро- 
действия ЭВМ. Другое направление развития в рамках этого использова- 
ния ПИИ определяется стремлением максимально приблизить цикл модели- 
рования а > В -+ 4 —* 1 к циклу моделирования а -» 6. Это проявляется 
в попытках оптимизации маршрутов 42 и 44 (развитие дружественных ин- 
терфейсов и распознающих систем, в частности нейросетей, а также оконеч- 
ных устройств ЭВМ), кроме того, — в попытках приблизить внешний язык 
общения с ПИИ к внутреннему языку (недоопределенная постановка, задач, 
естественно-языковые системы, системы распознавания рукописного текста, 
живой речи, а в идеале — мысли и т. п.). 

Известны попытки использования ПИИ в маршрутах ї и ћ в виде микропро- 
цессоров, иногда даже вживляемых в тело, управляющих работой внутренних 
органов человека. 

Об использовании ПИИ в маршрутах а или 6 сегодня речи не идет. 

Использование ПИИ в маршруте е возможно в той мере, в какой ПИИ 
соответствует понятию АИИ в объектах с автономным управлением. 

Очевидно, что перечисленные способы использования и направления 
развития ИИ в их традиционном понимании не выводят его из сферы опреде- 
ления ПИИ и не приближают его к понятию АИИ. Действительно, функци- 
онирование ИИ ОУ! здесь направлено на удовлетворение целям автономного 
управления АИ ОУ», и косвенно — целям объединенного объекта управления, 
но не на удовлетворение целям ОУ!. Более того, современная концепция 
систем ИИ противоречит рассмотренным понятиям автономного управления 
и естественного управления. Так, если автономный интеллект в принципе 


266 Глава 5. Системы автономного искусственного интеллекта 


не нуждается в подчиненном интеллекте, то ИИ как подчиненный интеллект 
нуждается в автономном интеллекте. Управление АИ принципиально зависит: 


а) от сложившихся в предыстории уникальной Базы Знаний АИ и системы 
эмоциональных оценок; 

б) от взаимодействия контролируемой и неконтролируемой управляющими 
системами информации; 

в) от функционирования истоков. 


Однако эти факторы не только не используются в современных системах ИИ, 
но специально исключаются из их функционирования. Объяснение этого раз- 
личия теперь можно легко видеть. Оно в том, что АИ (человеку) в общем слу- 
чае не нужен автономный искусственный интеллект как партнер по взаимодей- 
ствию в системе, а нужен именно ПИ. Поэтому в постановке задачи синтеза ИИ 
усматривается определенная подмена тезиса — ставя задачу создать человеко- 
подобный ИИ, мы на самом деле стремимся к созданию не АИИ, но ПИИ, т. е. 
идеального исполнителя, раба, не преследующего своих собственных интересов 
(целевых функций естественного управления), не обладающего своей индиви- 
дуально сложившейся системой оценок, лишенного возможности стать интел- 
лектом в результате длительного эволюционного приспособления к реальной 
среде. Для ПИИ свойства АИ не только не требуются, но категорически проти- 
вопоказаны! Как же мы хотим получить модель нервной системы и мозга для 
практического использования, если мы добиваемся того, чтобы этот объект 
не обладал наиболее существенными признаками нервной системы и мозга? 

Идея получить антропоморфный ИИ (т.е. АИ) без длительнейшего на- 
копления им опытных данных в процессе автономного управления в антро- 
поморфных же условиях существования абсурдна. Кроме того, сама цель 
синтеза ИИ в его общепринятом понимании ложна, что видно из следую- 
щего умозрительного эксперимента. Пусть антропоморфный ИИ создан, тогда 
он не может отличаться от человека по своим проявлениям. Использовать 
такой ИИ можно будет не более того, как можно использовать интеллект 
живого человека. В частности, необходимо будет предоставить ИИ свободу, 
иначе вступим в противоречие с нравственными нормами. 

Еще раз, но на другом примере. Поскольку говорить о создании искус- 
ственного мозга, сравнимого с мозгом человека, сегодня не приходится, то 
предположим, что удалось создать искусственный мозг даже не кошки, но хотя 
бы мышки (сегодня это непосильная задача). Тогда, как следует из сказанного 
в этой книге, надо, чтобы у этого искусственного мозга было и тело, подобное 
телу мышки. И вот у нас на лабораторном столе стоит искусственная мышь, 
ничем не отличающаяся от живой мыши по своим умственным и функцио- 
нальным способностям. Пусть эта замечательная мышь несет в себе такое же 
наследство многовековой эволюции, как и настоящая мышь. Что будем с ней 
делать, господа? Как именно можно использовать ее на практике, чтобы она 
приносила пользу нам, а не себе? Ответ — никак. Вы попросите ее рыть для вас 
нору? Она не захочет, так как у нее имеются свои естественные потребности. 
Ей хочется добывать пищу, гулять, исследовать окружающее пространство, 
размножаться и т. д. Попытка принудить ее к выполнению работы для вас 
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есть нарушение ее естественного права жить, никому не подчиняясь. Нужен 
ли нам именно такой искусственный интеллект, который есть у животных или 
у живого человека (неотделимый от его естественного права жить свободно 
и работая на себя, а не на кого-то)? Первый ответ — нет, нам не нужен ИИ, 
похожий на естественный интеллект! Нам нужен очередной, на сей раз — 
электронный раб, который бы день и ночь работал на нас, а не на себя. День 
и ночь без устали, не прося пищи и отдыха, выполнял бы для нас расчеты, 
переводил тексты, управлял технологическими установками, и т. д. и т. п. При 
этом для нас крайне важно, чтобы ИИ совсем не имел своих желаний (чтобы 
он не сказал, что хочет решать не нашу, а свою задачу), своих эмоций (чтобы 
он не говорил, что устал и у него плохое настроение, и поэтому он не хо- 
чет работать), чтобы он пользовался только достоверной информацией и не 
полагался на свой собственный опыт, чтобы в его работе не было и малого 
следа случайности, так необходимой естественному интеллекту. Проектируя 
сегодня свои машины, мы изо всех сил стараемся лишить их этих свойств, 
категорически необходимых системам ИИ, и при этом говорим, что хотим 
создать ИИ! Налицо лицемерие. Что же мы хотим получить на пути к цели, 
делая все возможное, чтобы этой цели не достигнуть? 

Итак, сделаем вывод. Те системы, которые сегодня разрабатываются в ком- 
пьютерных науках и называются системами ИИ, являются принципиальными 
антиподами естественному интеллекту практически по всем параметрам и са- 
мим целям и на самом деле являются очередными машинами, воплощаю- 
щими вековечную мечту иметь в своем распоряжении бессловесных, абсолютно 
услужливых, исполнительных, не знающих отдыха и сильных рабов, которым 
на этот раз поручено выполнять для нас, людей, в рабском режиме тяжелую 
работу по переработке информации. Работа эта должна выполняться абсо- 
лютно точно и достоверно, в полнейшем соответствии с нашими желаниями 
и прихотями, и ни в чем не выходить из-под контроля человека. Это абсолютно 
те же требования, которые всегда предъявлялись к рабам. И этот продукт 
нашей цивилизации не имеет никакого отношения к попыткам понять и смо- 
делировать принцип работы живых нервных систем и мозга. 

Развитие нашей технологии и техники, которое обычно объясняется целью 
создания лучших условий для жизни и лучших инструментов, логически 
перетекает в создание инструментов, которые будут работать без нас, но на нас. 
С другой стороны, техническая революция развивалась на фоне отступления 
эпохи рабства и не могла не пытаться компенсировать исчезающую возмож- 
ность располагать подневольным трудом. Многие машины изначально созда- 
вались и создаются с конкретной целью заменить труд человека, в том числе — 
подневольного человека. Поэтому цель создания систем ИИ не является 
исключением — финансирование разработок систем ИИ будет происходить 
только при условии, что системы ИИ обеспечат подневольное выполнение 
труда, приносящего прибыль. Возможно, поэтому в среде инженеров как 
специалистов по созданию технических устройств для подневольного труда 
явно заметно сопротивление попыткам моделирования естественных нервных 
систем. Ведь живой организм с его непредсказуемостью, эмоциональностью 
и необходимостью свободы — антипод технического раба, над созданием ко- 
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торого упорно трудится наша, наука и техника. Может быть, именно поэтому 
произнесенные еще в 1940 году Норбертом Винером слова «Не за горами день, 
когда окружающие нас вещи научатся думать и станут много более полезны 
обществу» до сих пор не претворены в жизнь? 

Пока наша культура еще очень далека от постановки задачи совершения 
такого творческого акта, как порождение новой, теперь искусственной жизни, 
которая бы жила, радуясь самой возможности жизни, развивалась и эволюци- 
онировала, не принося нам прагматической пользы в виде конечного продукта 
и прибыли. Пока мы только миримся с тем, что уничтожаем созданные 
природой виды живых организмов во имя нашего выживания и блага. 

Остается предложить варианты прагматической пользы, которую все же 
можно извлечь из разработки и последующей эксплуатации систем автоном- 
ного искусственного интеллекта. 


5.4. Прикладные системы 
автономного искусственного интеллекта (АЙИ) 


Развитие теории и разработка практически действующих систем автономного 
искусственного интеллекта (АИИ) могли бы приносить пользу в следующих 
сферах. 

1. В области фундаментальных наук. Успешная теория АИ осветила бы 
неясные стороны физиологии человека, его высшей нервной деятельности. 
Развитие физиологии могло бы породить полезные решения для клиниче- 
ской практики, для диагностики и, возможно, для лечения нервной системы. 
Теория АИ позволила бы создать более эффективные методики обучения, 
воспитания, общения людей. Теория АИ могла бы внести свой вклад в развитие 
различных наук физико-математического цикла: в теорию управления, теорию 
распознавания образов, теорию представления знаний и принятия решений, 
теорию искусственных нейронных сетей и другие разделы. 


2. В прикладной области. Успешные попытки синтеза систем АЙИ позво- 
лили бы обеспечить решение практических задач в трех направлениях: 
1) преобразование среды, полезное для человека, 
і) получение, накопление и использование информации о труднодоступной 
среде, 
їі) помощь человеку, аналогичная той, которую могут дать человеку до- 
машние животные. 


2.1. Задача (1) могла бы найти применение при управлении опасными про- 
изводствами, быстро или медленно протекающими технологическими процес- 
сами, регенерации среды. При этом сфера деятельности систем АИИ должна 
только определенным полезным для человека, образом пересекаться с эколо- 
гической нишей, занимаемой человеком. 


2.2. Задача (И) могла бы решаться в областях среды, труднодоступных 
для человека. Примеры прототипов прикладных систем ААУ, относящихся 
к направлению (1), мы приведем в гл. 6. 
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Необходимость в полезной для человека деятельности АИИ по решению 
задач (1), (й) может быть также связана с разными масштабами простран- 
ства и времени среды. Созидательная деятельность человека связана сегодня 
с определенным диапазоном измерений пространства и времени. При успехе 
создания АИИ в масштабах нано-, микро- или макромира, с регистрацией 
информации в диапазонах энергии, отличных от человеческого восприятия 
и временных масштабах, отличающихся от реально воспринимаемого челове- 
ком времени, возможно решение задач (1) и (її) в этих масштабах пространства. 


2.3. Задачи (Ш) могут быть очень разнообразными. Для того чтобы «уви- 
деть» эти возможные приложения, нужно представить себе, что привыч- 
ные вещи, окружающие нас, становятся в определенном смысле одушевлен- 
ными. Они приобретают свойства, присущие живым организмам, например, 
домашним животным. Главные свойства — это способность адаптироваться 
к человеку-хозяину, к свойствам среды обитания, к своим собственным свой- 
ствам и к свойствам задач, которые с их помощью решает человек-хозяин. 
Эта адаптация направлена на то, чтобы увеличить эффективность совместной 
с человеком жизни к обоюдной пользе обоих, т.е. человека-хозяина и са- 
мой вещи (снабженной аппаратом эмоций и тоже стремящейся улучшить 
свое существование). Точно так же, как ваше домашнее животное способно 
адаптироваться к вашим особенностям, привычкам, способам общения с ним, 
особенностям квартиры, и т. д., для того, чтобы своим поведением радовать 
хозяина, добиваясь от него материальных поощрений, практически каждое 
устройство в нашем окружении может тоже адаптироваться. 

Ваш собственный телефон имеет множество возможностей подстроиться 
под ваши особенности. Например: запоминать ваши часто набираемые номера 
и понимать их с полуслова, адаптироваться к вашим ошибкам и быстро 
исправлять их, адаптироваться к удобному именно вам уровню громкости, 
клавиши могли бы приобрести упругость и форму, удобную именно вам и соот- 
ветствующую вашей скорости набора номеров и форме ваших пальцев. Трубка 
могла бы, наконец, догадаться, что ее размеры и форма не очень подходят 
для вас, и измениться в нужном направлении. Тарифный план мог бы гибко 
меняться в соответствии с вашим способом использования телефонной связи. 

Ваш телевизор уже давно бы мог понять ваши привычки, настраиваться 
под них автоматически. 

Ваш автомобиль мог бы приспособиться к вашей манере езды, экономя 
топливо и материальную часть, кресла автомобиля могли бы уже понять, 
какими именно они должны были бы быть в соответствии с формами вашего 
тела. Неплохо бы, чтобы автомобиль перенял некоторые свойства старого коня, 
хорошо знавшего своего хозяина и способного в случае чего довезти его домой, 
прямо во двор, если хозяин нечаянно сладко уснул в телеге, возвращаясь 
с ярмарки. 

Неплохо было бы, если бы ваш компьютер приобрел свойства опытной 
секретарши, на практике узнавшей режим вашего рабочего дня, вовремя пода- 
ющей вам почту, материалы на подпись или кофе, знающей телефоны Марии 
Ивановны и Ивана Петровича, знающей ваши типичные ошибки и прочее 
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и прочее, что при правильной их коррекции способно существенно повысить 
эффективность вашего труда на рабочем месте. 

Продолжать примеры можно до бесконечности, потому что практически 
каждый прибор мог бы иметь адаптивную систему управления. 

И, как хорошо известно, развитие в направлении создания адаптивных си- 
стем сегодня уже активно осуществляется. Примеров можно указать много — 
это и «умный дом» Билла Гейтса, и некоторые элементы самонастройки 
в системах связи, в автомобилях и т. д. Однако все эти пока еще не ча- 
стые случаи базируются на решениях аа һосК, т.е. на эвристических спо- 
собах решения, придумываемых практически в каждом конкретном случае. 
Мы же предлагаем разрабатывать единую теорию автономного адаптивного 
управления, которая бы позволяла строить адаптивные системы управления 
на одних принципах — тех, по которым построены нервные системы живых 
организмов — универсальные автономные адаптивные системы, изобретенные 
самой природой. Подобная ситуация складывалась в свое время с системами 
распознавания, которые в большом количестве создавались эвристически для 
конкретных прикладных систем, пока все эти решения не были систематизиро- 
ваны и сведены к нескольким основным схемам [33, 34], которые и облегчают 
теперь разработку прикладных систем распознавания. 

Хотелось бы еще сказать о причинах, по которым сегодня тормозится 
разработка систем АИИ. 


1. Отсутствие общепринятой новой теории таких систем, основанной на био- 
нических принципах. Использовавшаяся ранее теория адаптивного управле- 
ния, основанная на математических моделях объектов управления, была очень 
сложна и в каком-то смысле исчерпывает уже свои возможности. 


2. Отсутствие массового спроса на такие системы по причине непонима- 
ния возможностей, которые могут открыть адаптивные системы управления, 
основанные на новых принципах. Но даже если некоторому заказчику нужна 
адаптивная система управления, и он при этом обращается к традиционной 
теории адаптивного управления, он либо видит, что эта теория не применима 
к его объекту, либо пугается сложности предлагаемого ею решения. 


3. Эффективность традиционных технологий изготовления вещей, 
устройств и приборов, которая научилась подменять необходимость само- 
настройки и самообучения вещей априорным их проектированием с учетом 
среднестатистических характеристик будущих условий эксплуатации. Здесь 
успехи эргономики, медицины, физиологии, психологии, архитектуры, про- 
мышленного дизайна и т. д. позволяют создавать вещи, заранее очень при- 
способленные под усредненного пользователя. Если еще к прибору приделать 
ручку с переключением свойств для нескольких классов пользователей — 
дырочки в ремне для полного и худого, спинку кресла откинуть или поднять — 
то этим в основном и обходятся сегодня все проблемы адаптации. Однако этот 
путь, хоть он и отражает «хитрость» человека, способного обмануть природу, 
все же не является прямым и радикальным, соответствующим природе. 
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В некотором смысле природный принцип эволюционного отбора с пере- 
дачей наследственности через генный механизм реализуется и в современной 
технологии, где роль генотипа играет техническая и технологическая докумен- 
тация, фиксирующая удачные находки предыдущих опытов, и где реализуются 
поисковые механизмы в новых пробах и ошибках. 


4. И наконец, одной из причин является, возможно, психологическое 
нежелание человека иметь вокруг себя слишком уж адаптивные, податливые 
и услужливые вещи. Кресло, которое мягко растекается под вами, не оказывая 
никакого сопротивления, не давая новых ощущений. Моментальное появление 
на экране компьютера только нужной вам информации без возможности 
увидеть что-то новенькое. Новый автомобиль, который ведет себя точно так 
же, как старый, и т. п. В некотором смысле от таких вещей можно быстро 
устать. Мир, наполненный такими адаптировавшимися к нам вещами, остав- 
ляет меньше возможностей для новых ощущений, новых впечатлений, при- 
носит меньше новой информации, что противоречит нашей целевой функции 
«накопление новых знаний». В большой степени нам приятно самим адап- 
тироваться к вещам. Нам интересна новая вещь, потому что она дает нам 
новые ощущения. Новое кресло, новый автомобиль, новый компьютер, новый 
человек, новый дом, новая среда — все это заставляет по-новому работать 
наши органы чувств, принося нам новую информацию, и это нам приятно. 

Тем не менее, развитие промышленности, насыщение нашей жизни тех- 
никой, ее проникновение во все поры окружающей среды создает «дефицит 
внимания человека к приборам», что требует оснащения их автономными 
системами управления, к тому же имеющими адаптивные свойства. Поэтому 
без разработки систем АИИ в будущем не обойтись. 

Настоящая книга, представляет собой попытку аргументировать целесооб- 
разность выделения нового направления развития систем искусственного ин- 
теллекта, а именно — систем автономного искусственного интеллекта (АИИ), 
с указанием сферы их возможного применения и технологии изготовления. 
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В этой главе будут представлены некоторые прототипы прикладных систем 
автономного искусственного интеллекта (АИИ), основанных на методе авто- 
номного адаптивного управления (ААУ). Все эти системы построены по одной 
схеме, изображенной на рис. 2.15. Программы систем управления написаны 
на разных языках программирования. Поскольку конструирование ведется 
не с помощью отдельных конструктивных деталей — «нейронов», а с помощью 
обычного современного компьютера последовательного действия, то нейросеть 
программируется доступными в программировании средствами, с использова- 
нием таких структур данных, как матрицы, векторы и т. д. При этом нейросе- 
тевое представление системы используется при проектировании программы, 
а также для понимания и объяснения ее принципа действия, т. е. приобретает 
статус метафоры. Однако между программой, написанной для компьютера 
последовательного действия, и сетью из нейронов, которая имелась в виду при 
составлении алгоритма программы, должно сохраняться определенное отно- 
шение изоморфизма. Иногда это отношение поддерживается автоматически, 
если для программирования нейросетевой управляющей системы используется 
специальный программный инструмент, который преобразует, например, сеть 
из нейронов, заданную конструктором непосредственно в графической форме 
или в форме матриц инцидентности, в соответствующий программный код. 

В зависимости от прагматических целей прикладной программы можно 
в разной степени придерживаться нейросетевой метафоры или отступать от 
нее. Кроме того, как отмечалось выше, система ААУ может быть реализо- 
вана не обязательно на нейроноподобных элементах. Придерживаясь состава, 
и схемы системы ААУ (рис. 2.15), а также функций, которые должна выпол- 
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нять управляющая система, можно ее отдельные подсистемы реализовывать 
с помощью различных подходящих методов распознавания образов, представ- 
ления знаний и т. д., которые соответствуют специфике прикладного объекта, 
управления. Поэтому одни подсистемы могут иметь нейросетевую интерпрета- 
цию, другие — иную. Некоторые прикладные системы управления построены 
со специальным условием максимального соответствия описанной нейросе- 
тевой метафоре, а в некоторых системах нейросетевая метафора отступала 
на задний план. Очевидно, что системы ААУ, предназначенные для разных 
объектов управления, могут отличаться друг от друга так же, как отличаются 
друг от друга нервные системы различных организмов. Но так же, как во всех 
нервных системах есть определенные общие черты, так и в наших прикладных 
системах имеется много общего — схема, принцип действия, основные свойства. 
При этом мы надеемся, что у них имеется нечто общее и с нервными системами. 

Описанные здесь прикладные системы создавались в разные годы и отра- 
жали наше собственное понимание метода ААУ. Они разрабатывались в ходе 
выполнения проектов НИР для конкретных объектов управления, поэтому мы 
не будем вдаваться в некоторые подробности, но опишем то, что характеризует 
их именно как системы автономного искусственного интеллекта (АИИ). 

При описании инженерных приложений обычно придерживаются опре- 
деленной терминологии, принятой в данной области науки и техники. При 
описании систем ААУ мы ввели свой словарь терминов, который отчасти 
пересекается с общетехническим словарем, отчасти является новым; в 
последнем случае мы давали определения понятий. Однако при описании 
систем ААУ как систем АИИ возникает большой соблазн использовать и дру- 
гую терминологию, принятую при описании поведения живых организмов. Это 
желание не случайно, так как система ААУ, порождающая систему АИИ, со- 
здавалась как модель живого организма. Отсюда и правомерное желание при 
описании поведения полученной модели живого организма — системы АИИ, 
пользоваться адекватной терминологией, т. е. называть вещи своими именами. 
Но, поступая так, мы рискуем столкнуться с сопротивлением специалистов 
из сферы точных и технических наук. Поэтому, считая все же, что при 
описании модели правомерно пользоваться терминологией, применимой 
к оригиналу, мы пойдем на компромисс и будем использовать ту и другую 
терминологию одновременно, а для устранения двусмысленностей предлагаем 
следующую таблицу соответствия некоторых терминов. 


Таблица 1 
Термин У 
р $ Наиболее близкий тер- 
для описания поведе- Термин, используемый р 
мин, используемый при 
ния живых организмов при описании 
Ж описании поведения 

и допустимый при системы ААУ 


технических систем 
описании систем АИИ 


УС сформировала образ 
Формир раз, В алфавите классов 


Оно узнало (знает) и в памяти образов появился 
системы распознавания 
об этом объекте (имеется) идентификатор М 
описан соответствующий 
(сцене, процессе). данного образа (обучен 


класс. 


некоторый нейрон). 
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Термин 
для описания поведе- 
ния живых организмов 
и допустимый при 
описании систем АИИ 


Оно знает, как себя 
вести в этой 
ситуации. 


Оно чувствует себя 
хорошо. 


Оно распознало 
неприятный объект 


(сцену, процесс). 


Оно приняло 
решение на рефлек- 
торном уровне. 


Оно приняло 


решение. 


Оно прогнозирует 
результат. 


Оно принимает 
решение. 


Оно обдумывает 
решение. 


Оно общается 
с другими животными. 


Термин, используемый 
при описании 
системы ААУ 


В Базе Знаний уже содер- 
жатся знания, соответ- 
ствующие этому образу. 


Эмоциональная оценка 
текущего состояния 
высокая. 


УС распознала образ 

с низкой эмоциональной 
оценкой. 

УС при принятии 
решения использовало 
априори известное знание, 


УС принимает решение с по- 
мощью непосредственного 
использования Базы Знаний. 


БЗ выдает образ ожидаемого 
результата, данного действия 


при данном образе условия. 


УС перебирает альтерна- 


тивные действия, подавая их 


в пробном режиме на БЗ 
и анализируя выдаваемые 
БЗ результаты. 


УС моделирует эволюцию — 


с помощью внешнего или 
внутреннего языка, 
возбуждает свою БЗ, 
наблюдая получаемые 
результаты и передавая 
их снова на вход БЗ. 

УС использует внешний 


язык для передачи и приема 


информации при взаимо- 
действии с внешними 
объектами. 


изначально записанное в БЗ. 


Продолжение таблицы 1 


Наиболее близкий 
термин, используемый 
при описании поведения 
технических систем 


Известна стратегия 
управления, которую 
следует реализовать 
при распознавании 
данного образа (класса). 
Текущая оценка качества 
состояния регулируемого 
процесса находится 

в допустимых границах. 


Контролируемый 
параметр вышел 
за допустимые пределы. 


Принятие решения 
по заданному закону 
управления. 


Принятие решения 

по заданному закону 
управления. 
Прогнозирование 

с помощью имеющейся 
математической 

(или другой) модели 
объекта управления. 


Принятие решения 
по заданному закону 
управления. 


Принятие решения 
по заданному закону 
управления. 


Прием/передача, 
информации по каналам 
связи согласно 
протоколу. 
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6.1. Адаптивная система управления 
угловым движением 
автоматического космического аппарата 


Этот прототип прикладной системы, названной нами «Пилот», создавался 
в сотрудничестве с НПО им. А. С. Лавочкина и подробно описан в работах 
[23, 35-42]. Проблема, решение которой может быть связано с применением 
метода ААУ, состоит в данном случае в следующем. 

Рассматривая полет автоматического космического аппарата (АКА) в кос- 
мическом пространстве, можно выделить его поступательную и угловую со- 
ставляющие. При полете в космосе сила трения окружающей среды практиче- 
ски отсутствует, и движение космического аппарата, определяется в основном 
силами инерции, силами тяги двигателей, если они включены, силами грави- 
тационного и магнитного полей, давлением солнечного ветра и некоторыми 
другими причинами. 

Угловое движение вокруг своего центра масс является неотъемлемой 
компонентой движения всякого тела, летящего в космическом пространстве, 
у АКА оно изменяется под действием: векторов сил двигателей, неравномер- 
ного действия магнитного поля на отдельные компоненты АКА, неожиданных 
утечек газа, изменения конфигурации АКА и других причин. Рассматривать 
угловое движение удобно как движение связанной с АКА прямоугольной 
системы координат с центром в центре масс АКА относительно заданной, 
«опорной» системы координат с центром в той же точке центра масс АКА, 
рассматривая отдельно движение вокруг каждой из осей опорной системы 
координат. При малых углах движения вокруг различных осей опорной си- 
стемы координат можно считать независимыми. Характеризовать состояние 
углового движения объекта можно с помощью таких характеристик, как угол 
рассогласования текущего и заданного положения одноименных осей связан- 
ной и опорной систем координат (обозначим его через ф({)), угловая скорость 
(1-я производная от угла по времени ‹’(#) = аф(®) /а, угловое ускорение (2-я 
производная угла по времени ф”(Р) = 44! (0) /40)) и, при необходимости — 
следующими производными и другими целесообразными характеристиками, 
с помощью которых можно описывать временные кривые. 

Часто возникает необходимость поддерживать угловое положение 
АКА в некотором заданном состоянии. Например, на АКА может быть уста- 
новлена научная наблюдательная аппаратура, требующая точного наведения 
на цель наблюдения в течение сеанса наблюдения. Это может быть телескоп, 
который должен быть наведен на исследуемый объект в космосе в течение 
определенного времени. Заданное состояние может выражаться не только 
в указании требуемого угла рассогласования, который надо поддерживать, 
но и в указании заданной угловой скорости и/или углового ускорения. 
Поддержание АКА в заданном угловом положении продолжительное время 
оказывается непростой задачей. Необходимо иметь: 


а) измерительную аппаратуру, которая способна регистрировать рассогла- 
сование текущих и заданных характеристик углового движения, 
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б) приводы, которые могут воздействовать на угловое движение АКА; 

в) бортовую цифровую вычислительную машину (БЦВМ) для управления 
приводами; 

г) систему управления в виде программы для БЦВМ, которая принимала, 
бы решения о том, какие управляющие воздействия должны совер- 
шить приводы в текущем состоянии, чтобы привести угловое движение 
АКА в требуемое состояние. 


В систему управления должно вводиться также положение «опорной» системы 
координат и/или заданное положение АКА, к которому следует стремиться. 

Обычно система управления строится следующим способом. Составляется 
математическая модель углового движения АКА, представляющая собой си- 
стему нелинейных дифференциальных уравнений 2-го порядка, — так назы- 
ваемая «динамическая схема» углового движения АКА. В этой математи- 
ческой модели АКА представляется как абсолютно твердое тело с набором 
закрепленных на нем нелинейных осциллирующих элементов с заданными 
характеристиками. Эти осцилляторы представляют собой такие детали АКА, 
как солнечные батареи, антенны и другие характерные крупные узлы, которые 
существенно влияют на угловое движение АКА. Подобные узлы сами по себе 
являются сложными составными конструкциями, далекими от таких мате- 
матических абстракций, как математический маятник, математическая пру- 
жина и т. п., а потому их движение описывается нелинейными уравнениями, 
содержащими, например, пороговые значения, при переходе через которые 
некоторые параметры (жесткость, амплитуда и т. п.) изменяют свои значения. 
Составление математической модели объекта управления такого рода весьма 
трудоемко. Поэтому в математической модели АКА учитываются далеко не 
все осциллирующие элементы, а только несколько самых основных, например 
по три элемента, в уравнениях, описывающих движение АКА вокруг каждой 
из осей опорной системы координат. Система уравнений математической мо- 
дели позволяет узнать, как будут изменяться угол ф(Ё) и угловая скорость ф’'(#) 
во времени, если на АКА, который в текущий момент времени имел такие-то 
угловые характеристики и на который действуют такие-то моменты Мьозм 
«возмущающих» сил, подействовать определенным моментом «управляющих» 
сил Мупр. Пример такого движения показан на рис. 6.1. 

Можно видеть, что после приложения некоторого управляющего воздей- 
ствия Муһр АКА начинает совершать сложное колебательное движение, со- 
стоящее из суммы нескольких нелинейных колебаний, обусловленных коле- 
баниями, например, солнечных батарей, антенн и т. п. Составив такую си- 
стему уравнений, находят ее обратное решение, показывающее, какое именно 
управляющее воздействие надо приложить к объекту управления, чтобы пе- 
реместить его в требуемое положение, которое, в свою очередь, должно быть 
заранее указано (например, пусть требуется держать рассогласование по углу 
и по угловой скорости в нуле). 

При управлении этим объектом, как и многими другими, речь фактически 
идет об управлении будущей его эволюцией на основании информации о те- 
кущем положении и с помощью управляющих воздействий. Будущее здесь — 
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А 


А 
> 
время, ї 


Рис. 6.1. Пример временного хода угла рассогласования и его первой производной 
после создания приводом некоторого импульса управляющего воздействия на АКА 


это те моменты, которые по оси времени лежат дальше, чем текущий момент, 
соответствующий моменту принятия решения и предшествующий соверше- 
нию управляющего воздействия Мупр. При традиционном способе управле- 
ния принятие решения базируется на знании, предсказании этого будущего 
поведения АКА, основанного на рассчитанной математической модели. При 
этом принятие решения сводится к выбору Мупр но «закону управления», 
где зафиксированы заранее рассчитанные по математической модели значения 
Мулр, оптимальные для всех возможных значений используемых аргументов. 
В случае АКА аргументами «закона управления» могут быть наблюдаемые 
значения угла ф(#) и угловой скорости ф'(®). На рис. 6.2 показан примерный 
вид «закона управления» 


Мупр(Ф(®, Ф'(2)) — К(К о (ж) + К : Ф'(8)), 


где К — некоторая функция, Ко) и К, (е) — постоянные. 

Понятно, что точность предсказания, прогноза реакции АКА на конкретное 
управляющее воздействие Мупр зависит от точности рассчитанной математи- 
ческой модели АКА. Однако эта модель не может быть очень точной в силу 
следующих причин: 


а) модель огрублена (учитываются не все осциллирующие элементы) с це- 
лью уменьшения ее сложности, находящейся на пределе возможностей 
вычисления; 

б) численные коэффициенты, заложенные в модель — коэффициенты упру- 
гости, декременты затухания и т. д., не очень точны, потому что они 
снимаются в экспериментах на наземных стендах, где невозможно в пол- 
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Мупр 


Ко Ф( + КФ! (0) 


Рис. 6.2. «Закон управления» АКА, вычисленный аналитически 


ной мере воспроизвести условия космического полета — невесомость, 
глубокий вакуум, контраст температур и некоторые другие условия; 

в) свойства АКА могут изменяться во время полета, в том числе — зара- 
нее непредсказуемым образом, в результате чего значения параметров 
модели АКА начинают отличаться от свойств реального объекта управ- 
ления. 


В результате указанных причин возникает рассогласование свойств объ- 
екта управления и заранее рассчитанного закона управления, что приводит 
к уменьшению точности управления. В результате качество управления па- 
дает, угловое положение АКА не стабилизируется так, как этого хотелось бы 
достичь в тех или иных ситуациях. 

Отсюда возникает необходимость применения адаптивного метода управ- 
ления. Мы предположили, что применение метода ААУ может дать более 
перспективные результаты, чем адаптивный подбор коэффициентов матема- 
тической модели ОУ, заранее заданной в аналитической форме, потому что 
система ААУ может учитывать факторы, не ограниченные заданным видом 
закономерности закона, управления. 

Итак, идея применения системы ААУ для управления угловым движе- 
нием АКА состоит в следующем общем для нас подходе. Мы должны по- 
местить управляющую систему ААУ как автономный искусственный интел- 
лект (АИИ) — некоторое «живое существо», внутрь объекта управления, 
в данном случае — автоматического космического аппарата, дать управля- 
ющей системе возможность наблюдать за существенными для управления 
параметрами, предоставить ей эффективные актуаторы — рули, и поставить 
эмоциональные оценки ее аппарата, эмоций в соответствие с нашими целями, 
чтобы стремление системы ААУ к выживанию совпадало бы, по возможности, 
с желаемым для нас состоянием АКА. Далее система ААУ должна, самосто- 
ятельно найти способ управления конкретным «телом» АКА, находящимся 
в конкретной среде — космическом пространстве с характерными возмуще- 
ниями, действующими на АКА. При этом мы не даем управляющей системе 
закона управления в готовом либо в аналитически заданном виде в обычном 
смысле. УС должна найти способ управления самостоятельно. 


6.1. Система управления угловым движением космического аппарата 279 


Мы должны выполнить условия, принятые для систем ААУ, а именно 

следующие. 

а) Условие автономности выполняется тем, что управляющая си- 
стема (УС) ААУ находится внутри объекта управления (ОУ) и не по- 
лучает оперативных подсказок извне. 

б) Условие дискретности выполняется самими алгоритмами УС. 

в) Условие максимальной начальной приспособленпости. Оно должно ком- 
пенсировать нашей системе ААУ отсутствие у нее многих поколе- 
ний предков ее вида, которые в процессе эволюционного отбора опре- 
делили многие параметры, облегчающие новорожденному индивиду 
системы ААУ выживание и приспособление к условиям существова- 
ния. Эти найденные предками параметры должны быть реализованы 
не только в самом фенотипе ОУ, в его датчиках и актуаторах, но и в его 
управляющей системе, во многих ее конструктивных и алгоритмических 
деталях. Мы должны также компенсировать нашей УС отсутствие у нее 
родителей, которые могли бы охранять существование новорожденного 
ОУ, пока он не накопил достаточно опыта для того, чтобы не погибнуть 
в незнакомой среде, пока не будут накоплены минимально необходимые 
знания, а также то, что родители не передали УС ААУ некоторые знания 
и опыт управления, приобретенные в данной конкретной среде. Выпол- 
нению этого условия мы уделим ниже большое внимание, употребив 
всю доступную априорную информацию для того, чтобы максимально 
сузить пространство поиска, в котором УС ААУ будет искать необходи- 
мые знания. 

г) Наконец, условие минимума начальной информации в данном случае 
выполняется тем, что мы оставляем за управляющей системой поиск 
знаний о функциональных свойствах заданного АКА, не навязывая УС 
заранее определенного закона управления в его аналитической форме. 
Это именно та информация, которую мы не можем знать заранее о дан- 
ном АКА и которую УС должна найти самостоятельно, а также должна 
будет корректировать в случаях, если свойства АКА будут изменяться 
в течение полета. 


Рассмотрим все подсистемы системы ААУ с позиций двух точек зрения — 
изложенного выше метода ААУ и условия максимальной начальной приспо- 
собленности. Для того чтобы максимально приспособить ОУ и УС к средним 
условиям их существования, мы можем опереться на знания, эмпирически 
и теоретически добытые в прошлом людьми-специалистами и зафиксирован- 
ные в технической и научной литературе. Для УС нам надо определить все 
подсистемы системы ААУ, которые рассмотрим далее по порядку. 


6.1.1. Блок датчиков, подсистема ФРО 
и аппарат эмоций УС для АКА 
С точки зрения метода ААУ, управляющая система представляет собой на- 


блюдателя, который должен эмпирически найти способы управления задан- 
ным объектом управления и применять найденные знания для того, чтобы 
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прошлое 


А время 


настоящий момент 


Рис. 6.3. Временной ход угла рассогласования ф(#), на который можно влиять 
управляющими воздействиями Мупр 


держать ОУ в наиболее комфортных состояниях. Комфортность состояний 
определяется заданными «эмоциональными оценками» образов, которые опи- 
сывают возможные состояния ОУ. 

Управляемый процесс в данном приложении можно представить времен- 
ным ходом параметра Ф(1), на который можно влиять с помощью управляю- 
шего воздействия Мупр (рис. 6.3). 

Чтобы УС ААУ была заинтересована в управлении данным АКА с нуж- 
ными нам целевыми функциями, поставим ее эмоциональный аппарат в зави- 
симость от параметров, которые описывают эти целевые функции. В данном 
случае, пусть УС ААУ чувствует себя тем хуже (тем меньше общая текущая 
оценка 5(#) состояния ОУ в аппарате эмоций), чем больше по модулю откло- 
нение АКА от заданного положения, т. е. чем больше модуль угла (ё). Тем 
самым, УС будет стремиться в каждый следующий момент времени перевести 
АКА в состояние с наименьшим из возможных углом рассогласования. Для 
наблюдения за углом рассогласования ф(®) мы должны дать УС возможность 
наблюдения за этим углом, что физически реализуется в виде датчиков, 
измеряющих угловое ускорение с последующим двойным интегрированием 
данных по времени и сглаживанием с помощью фильтра Калмана. 

Для того чтобы УС могла влиять на угловое положение АКА, ей надо 
дать возможность инициировать актуатор, который способен воздействовать 
на угловое движение АКА. Таким актуатором может являться так называл 
емый инерционный привод, физически представляющий собой три маховика 
(в обычном состоянии неподвижных, в отличие от гироскопа), оси которых 


6.1. Система управления угловым движением космического аппарата 281 


совпадают с осями связанной системы координат АКА. Раскручивая с ускоре- 
нием такой массивный маховик шаговым электродвигателем, мы заставляем 
АКА вращаться в противоположную сторону. Работая с одним маховиком, мы 
управляем угловым движением АКА в одной плоскости. 

На АКА установлена традиционная система управления угловым движе- 
нием, которая хорошо справляется со своим назначением при углах рассогла- 
сования, лежащих за пределами диапазона [ф(Р) ив; Ф(К) шах]. Нет смысла отка- 
зываться от системы управления, которая хорошо работает в своем диапазоне 
значения параметров, поэтому поручим УС ААУ управлять АКА только в тех 
ситуациях, когда текущий угол рассогласования 


Ф(#) ьа < 9) < (Е) ах: 


Если же угол рассогласования выходит за указанные границы, то УС ААУ 
может временно отключиться, управление пусть берет на себя традиционная 
система управления (которую будем называть «внешней», так как она работает 
за пределами рабочего диапазона УС ААУ) и борется за АКА до тех пор, 
пока ей не удастся вернуть угол рассогласования в указанный диапазон. 
После чего компетенция в управлении опять переходит к УС ААУ. В этот 
момент УС ААУ распознает, что угол Ф(Р) появился в случайном месте 
диапазона [ф( и; Ф(Р) ах], и это служит для нее сигналом к началу работы. 
Таким образом, внешняя система управления является как бы нянькой, 
следящей за тем, чтобы УС ААУ не натворила какой-либо беды, например, 
в состоянии, когда она еще не обучена и совершает много случайных 
действий. Контролем внешней системы управления и обеспечивается гарантия 
безаварийной работы АКА. 

Управление УС ААУ может осуществлять, если она обнаружит закономер- 
ные ситуации в эволюции управляемого АКА в прошлом и научится управлять 
ими, экстраполируя их в будущее. Закономерности УС понимает как образы. 
Как мы говорили выше, среди всех образов выделяются специальные 
образы — знания, которые состоят из последовательно распознаваемых 
образов трех видов: а) образов условий, б) образов действий и в) образов 
результатов. Очевидно, что образы условия в случае АКА могут быть очень 
сложными и отражать самые сложные закономерности в его поведении. 
Например, это закономерные повторяющиеся куски временного процесса, 
сложного колебательного движения АКА. Образы действий тоже могут 
быть составными, сложными и протяженными — какие-то определенные 
последовательности действий актуаторов. Образы результатов тоже могут 
отражать длительные неслучайные фрагменты эволюции АКА, закономерно 
следующие за определенными образами условия и действия. Например, вся 
ситуация, изображенная на рис. 6.4, может представлять собой закономерный 
фрагмент эволюции АКА, и, если бы он был выявлен и записан в Базу 
Знаний УС, то это было бы некоторое знание. Здесь «прошлое» могло 
бы соответствовать образу условия, управляющий момент Мупр — образу 
действия, а «будущее» — образу результата. К выработке такого вида «знаний» 
и следует стремиться. Но это весьма непростая задача. Для того чтобы уметь 
распознавать такого рода непростой колебательный процесс, надо применить 
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Рис. 6.4. Управление высокоинтеллектуальной УС — анализируется длительная 

предыстория (образы условия), учитываются долгосрочные результаты в будущем 

(образы результатов), действия экономны, но очень точны, актуаторы расходуют 
мало энергии 


довольно сложные алгоритмы распознавания. Такой алгоритм можно было бы 
построить на основе какого-либо спектрально-временного анализа с помощью 
Фурье-преобразований или подобных методов. Можно также построить до- 
вольно сложную нейроноподобную сеть, способную распознавать такого рода, 
пространственно-временные прообразы. Возможно, что нейросети, способные 
формировать образы таких фрагментов эволюции, и могут выработаться 
в процессе эволюционного развития объектов управления такого вида, будь 
они биологическими объектами. Но мы сейчас должны заменить данному ОУ 
его предков и «руками» задать правила для формирования требуемых образов. 

Будем исходить из того, что полезные для управления «знания» могут 
быть и не такими сложными. Обратимся к нашей «генетической» памяти, 
представленной в копилке научной литературы, что может заменить опыт от- 
сутствующих предков нашей УС. Теория управления говорит, что для управле- 
ния угловым движением динамических объектов, подобных АКА, достаточно 
иметь информацию по углу рассогласования ф(Ё) и угловой скорости ф'(#) на 
текущий момент времени. Хотя лучше было бы иметь еще и информацию по 
ускорению ф”(Ё) и по другим производным — 0'"(1) ит. д., т.е. максимально 
приблизиться к полной информации об этом временном процессе. Заметим, что 


Ф' (0) =Ф(® – ФЕ – 1), 
Ф" (0) а (0) – (Е 1) е (0) – 20(2— 1) + ф(2 – 2), 


ит.д. т.е. знание производных высоких порядков дает определенное 
представление о временном ходе описываемой величины. Конечно, для 
ее описания можно привлечь и другие формы, например гармоники. Мы 
попробуем ограничиться информацией по (0), ф’(Р) и ф"(®), т. е. будем искать 
закономерности эволюции, проявляющиеся всего на трех тактах дискретного 
времени $, #—1,#—2 (рис. 6.5). Укоротить цикл управления нас поощряет еще 
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Рис. 6.5. Управление малоинтеллектуальной УС — анализируется короткая предыс- 
тория, учитываются только результаты в самом ближайшем будущем, действия 
не очень экономны, и не очень точны, актуаторы расходуют много энергии 


и тот факт, что используемый в качестве актуатора шаговый электродвигатель 
может совершать управляющие воздействия довольно часто, например 10 раз 
в секунду. Поэтому мы можем вместо повышения интеллекта УС переложить 
часть нагрузки на актуатор, заставляя его работать часто и управляя как бы 
«коротким умом» — ликвидировать только главную часть рассогласования, 
не учитывая более отдаленных последствий своих собственных команд. 
За отсутствие дальновидности при принятии решений будем расплачиваться 
топливным ресурсом. В этой ситуации мы готовы предоставить УС возмож- 
ность постоянно бороться самой с собой, как не очень умному управляющему 
который, вместо того, чтобы в тиши кабинета продумывать долгосрочные 
последствия своих указаний, совершаемых редко, но метко, каждое утро бежит 
вместе с подчиненными ликвидировать очередной кризис, вызванный своими 
же собственными недальновидными предыдущими решениями, проявляя при 
этом кипучую деятельность и близость к исполнителям. 

И еще одно обстоятельство заставляет нас сократить длительность отыски- 
ваемых закономерностей. Для того чтобы искать закономерные долговремен- 
ные фрагменты эволюции в прошлом, необходимо обеспечить хранение исход- 
ных данных за соответствующий длинный период прошлого. Хранение такого 
большого архива — задача непростая. Для БЦВМ, ресурсы которых обычно 
очень ограничены, эта задача может оказаться невыполнимой. Поэтому чем 
меньше данных о прошлом требуется хранить в памяти БЦВМ, тем лучше. 

Итак, для обучения УС в качестве образа условия будем распознавать образ 
текущих значений ф(#) и Ф'’(®), что составит словарь признаков подсистемы 
формирования и распознавания образов (ФРО). Согласно методу ААУ, образы 
должны быть дискретными объектами, а информация о величинах Ф(Р) и 
‹р’(Р) поступает от датчиков практически в непрерывном виде. В данном ОУ 
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нам не нужно организовывать процедуру самообучения для того, чтобы по- 
лучать образы этих величин. Вполне можно применить геометрическую си- 
стему распознавания с заранее заданными решающими правилами. Поэтому 
строим сетку решающих границ, разбивающую фазовую плоскость (фФ(Р) и 
‹’(Р)) — пространство признаков — на области, соответствующие распознавае- 
мым классам — образам (рис. 6.6). Каждый из таких образов соответствует 
некоторому континууму значений ф(Р) и 0! (0), которые УС будет относить 
к одному образу. Поскольку у нас пока нет никакой априорной информации 
о более целесообразном разбиении признакового пространство решающими 
границами, выбираем равномерное разбиение. Ниже (см. рис. 6.7) мы вернемся 
к вопросу о более обоснованном выборе этих решающих границ. 

В качестве образа, действия будем использовать номер совершаемого дей- 
ствия. 

Специального рассмотрения требуют и образы результата. Очевидно, что 
чем больше мы огрубляем образы условия, тем менее точно мы можем про- 
гнозировать будущее. Этот факт мы отразили на рис. 6.3 в виде расширяю- 
щихся со временем доверительных интервалов на экстраполируемой в буду- 
щее (прогнозируемой) кривой эволюции. Это также является прямой платой 
за ограниченность «интеллекта» УС. Очевидно, что чем умнее УС, чем более 
длительные по времени закономерности может найти и использовать УС, тем 
точнее она может прогнозировать будущее. Если мы находим эту закономер- 
ность в прошлом, то она проявляется в том, что при одинаковых распознанных 
образах условия и одинаковых совершенных действиях полученные резуль- 
таты были идентичными, либо закономерная реакция в эволюции проявляется 
в некотором определенном виде, который и требуется найти. Для поиска, такой 
закономерности следует применить подходящий метод автоматической класте- 
ризации. В случае с АКА это может выглядеть так, как показано на рис. 6.6. 

Проводилось большое число экспериментов с одним и тем же образом 
условия Од, одним и тем же действием, и рассматривались полученные ре- 
зультирующие состояния. 

Реальные состояния АКА, которые УС распознавала как образ Од, состав- 
ляли множество различных точек А со случайными значениями (ф(®), {'(0)), 
принадлежащими области определения данного образа. Каждый раз при рас- 
познавании образа Од УС в этом эксперименте давала команду совершить 
одно и то же действие Мупр. При этом АКА переходил в состояния, отмеченные 
на рис. 6.6 точками В, образовавшими вытянутую по диагонали «тучку». 

В данном примере подсистема ФРО могла распознавать состояние ОУ 
в форме одного из 121 образов условия с номерами (р, "), которым соответ- 
ствуют 81 закрытая прямоугольная область и 40 открытых областей на фазо- 
вой плоскости (рис. 6.6). Например, состояние ОУ, физически соответствую- 
щее точке А, распознавалось как образ Од с номером (3, 5). 

Если описывать образы результата так же, как образы условия, т. е. обла- 
стями с координатами (р, г), аналогичными образу Од, то видно, что результат 
попадал с разными вероятностями в разные образы (р, "). Поэтому если образы 
результата брать из того же множества, что и образы условия, то потребо- 
валось бы строить вероятностную Базу Знаний. Задача вполне выполнимая, 
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Рис. 6.6. Фазовая плоскость (ф’'(#), Ф(#)) и информационные объекты, описывающие 

возможные физические состояния АКА. А — исходное состояние АКА в терминах 

(4'(0), Ф(0)), В — состояние в терминах ('(#), 2(1)), в которое ОУ переходит после 

совершения определенного действия, р и т — координаты образов состояния ОУ 

(образов условия), з — номера образов результата и одновременно — номер эмо- 
циональной оценки образа состояния ОУ 


но в жизни, если обратиться к своему опыту, мы видим, что образы результатов 
действий далеко не всегда, берутся из того же множества, что и образы усло- 
вий. Потому что результат обычно представлен более размыто, чем исходное 
условие. Это имеет ту же природу, по которой, например, при одной и той же 
наводке орудия снаряды никогда не ложатся в одну и ту же воронку, а дают 
некоторое распределение, характеризующееся кучностью стрельбы. Кучность 
данного орудия — это и есть образ результата, на который можно полагаться 
при стрельбе. Этот образ возникает в результате кластеризации результатов 
многих экспериментов. Еще пример — бросая на пол чашку, мы ожидаем 
увидеть результат в виде образа разбитой чашки, но этот образ не описывает 
нам конкретных осколков, это нечто общее, что есть у всех разбитых чашек. 
Итак, образ результата действия — это то, что можно найти в множестве 
опытов совершения одинакового действия в одинаковых условиях. 

Для того чтобы сформировать кластер, нужно задать правило его фор- 
мирования на основании некоторых геометрических характеристик, опреде- 
ленных в некоторой метрике. Основанием для выбора таких характеристик 
и метрики являются содержательные соображения, идущие от понимания 
конечного назначения этих образов. А именно, надо помнить, что распозна- 
вание образов необходимо ОУ для того, чтобы выжить во взаимодействии 
с данной средой. ОУ обеспечивает свое выживание посредством действий. 
Следовательно, это должны быть такие образы, которые наиболее информа- 
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тивны для принятия решения о наиболее эффективных действиях. В природе 
такие правила формирования образов результатов, по-видимому, отыскива- 
ются также в результате эволюционного поиска. Например, из всего того, что 
видит водитель автомобиля в лобовое стекло, для него наиболее важными 
являются границы свободной для проезда зоны, в которую он может направить 
автомобиль. При этом водитель все время классифицирует препятствия на два 
класса — на те, на которые можно наехать («свободная» для проезда зона), 
и те, на которые не следует наезжать, пользуясь относительной «платежной 
матрицей» предполагаемых им штрафов (те объекты, на которые он может 
наехать в одних обстоятельствах, он объедет стороной в других обстоятель- 
ствах). 

Итак, для выживания АКА можно предложить правило, которое наиболее 
эффективно и наиболее вероятно отражало бы удаление или приближение 
АКА к его целевой функции, выраженной в эмоциональной оценке состоя- 
ния ОУ, соответственно и в рассогласовании угла. Поэтому для формирования 
кластера, соответствующего образу результата действия в АКА, можно пред- 
ложить, например, следующее геометрическое правило. Образ результата, опи- 
сывается такой границей, которая гарантирует, что результирующие состояния 
ОУ не выйдут за пределы этой границы с заданной вероятностью. Наиболее 
простая метрика для измерения расстояний здесь может быть выражена в виде 
концентрических рамок, границы которых совпадают с границами разбивки 
фазовой плоскости на образы условий (рис. 6.6). Кластером — образом ре- 
зультата может быть прямоугольник с центром в целевой точке. Так, на фа- 
зовой плоскости (рис. 6.6) определено шесть образов результатов, которые 
пронумеруем от периферии фазовой плоскости к центру для того, чтобы 
установить прямое соответствие номера образа результата, с его эмоциональной 
оценкой. 

Эмоциональная оценка 5 состояния ОУ может быть выражена как удале- 
ние образа состояния ОУ от образа целевого, желаемого состояния. В данном 
случае эта оценка находится в обратной зависимости от удаления от центра 
фазовой плоскости, которое можно измерять «радиусом» прямоугольных ра- 
мок, совпадающих с границами образов результатов. 

Показанный случай соответствует формированию образа результата Оз, 
потому что область результирующих состояний В полностью покрывается 
прямоугольной областью с номером 3. Можно предложить и другие правила 
для формирования образов результатов. 

От свойств образов результата, зависит также такая важная возможность 
системы ААУ, как возможность продумывания решений на несколько ша- 
гов вперед. Эта возможность, как было сказано выше, реализуется с помо- 
щью языковых средств. Например, если бы в результате совершения дей- 
ствия АКА переходил в состояние, которое можно было бы описать таким 
же образом, как образ условия, т.е. «тучка» точек В покрывалась бы од- 
ним образом (р, "), и УС располагала бы языковыми средствами обращения 
к своей БЗ, то УС могла бы моделировать альтернативные варианты эволюции 
АКА на несколько шагов вперед, выбирая лучший из них по величине суммы 
оценок результатов. Для этого УС надо было бы к пробному прогнозируемому 
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Рис. 6.7. Оптимальные границы «полей зрения» датчиков, найденные с помощью 
генетических алгоритмов (сравн. с рис. 6.6) 


результату, как к прогнозируемому образу условия, «в уме» применить разные 
действия. 

Свойства реального АКА будут проявляться в том, какие именно переходы 
от образов условия к образам результатов будет демонстрировать данный 
конкретный АКА. Вместо аналитического расчета математической модели 
этого АКА и его свойств, мы просто будем наблюдать за отражением эво- 
люции АКА в терминах описанных информационных объектов, и записывать 
результаты наблюдения в Базу Знаний (БЗ). 

Здесь вернемся к вопросу о выборе разбиения признакового простран- 
ства на области, соответствующие «полям зрения» датчиков. Аналитическому 
расчету оптимальных границ мы предпочли генетические алгоритмы для 
сохранения методологического единства при синтезе системы. Применение 
генетических алгоритмов для выбора границ полей зрения датчиков дало 
следующий результат (рис. 6.7). Оказалось, что оптимальным для принятых 
критериев оказывается деление признакового пространства на неравные поля 
зрения, при этом датчики должны обеспечивать не только «центр четкого 
видения» вблизи целевой точки, но и определенную зону четкого видения 
ближе к границам поля зрения. Тем самым, равномерное деление признакового 
пространства, показанное на рис. 6.6, не является оптимальным. 


6.1.2. База Знаний 


Для того чтобы понять свойства углового движения заданного АКА, УС 
должна наблюдать за эволюцией АКА в терминах описанных выше инфор- 
мационных объектов, сохраняя результаты наблюдений в Базе Знаний (БЗ). 
Совокупность мероприятий, направленных на познание свойств предъявлен- 
ного ОУ, и будет реализовывать достижение целевой функции «накопление 
знаний». Заметим, что фиксация результатов наблюдений эволюции ОУ может 
происходить независимо от того, каким способом ОУ проявлял свою актив- 
ность, кто и с какой целью принимал решения и инициировал их выполнение. 
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Рис. 6.8. База Знаний УС АКА в табличной форме 


Принимались ли решения случайным способом или ОУ специально провоци- 
ровался на выполнение действий с познавательными целями, принимались ли 
решения самой УС, опирающейся на уже имеющиеся знания, или решения 
принимала внешняя система управления — от этого в общем случае может зал 
висеть только скорость и полнота, обучения. Однако при формировании слож- 
ных многоуровневых знаний результат обучения может зависеть от последо- 
вательности демонстрации «дидактического материала». Возможны и другие 
эффекты влияния «программы» обучения на его результаты. Пока рассмотрим 
самый простой случай, предполагающий независимость результатов обучения 
от способов подачи учебного материала. 

Для фиксации результатов наблюдения за поведением АКА организуем БЗ 
в виде прямоугольной таблицы (рис. 6.8). Пусть столбцы таблицы БЗ соответ- 
ствуют образам условия, отражающим текущее состояние АКА. В каждый 
момент времени может быть распознан один и только один из таких образов, 
поскольку в данном случае это несовместные образы. Строки таблицы БЗ 
пусть соответствуют номерам образов действий в некотором удобном порядке. 
В данном случае действия соответствуют импульсам управляющих воздей- 
ствий инерционного привода АКА, который может подталкивать АКА с раз- 
ной силой в ту или другую сторону вокруг рассматриваемой оси связанной 
системы координат. Поэтому середина шкалы пусть соответствует нулевому 
воздействию, выше в порядке возрастания силы расположены образы воздей- 
ствий, подталкивающих АКА в сторону положительных углов ф(®), ниже от 
середины оси расположены образы воздействий, толкающих АКА в сторону 
отрицательных углов Ф(®), в порядке возрастания силы. 

В начале работы УС таблица БЗ может быть пустой. Пусть УС начинает 
совершать некоторые действия по любому заданному ей алгоритму. Например, 
это может быть случайный перебор (в этом случае УС только обучается, 
но не управляет, т. е. работает только на цель «накопление знаний», но не на 
цель «выживание»). Немного позже укажем более разумную стратегию при- 
нятия решений с учетом обеих целевых функций. 
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В данном случае образы условия у нас не формируются, а сразу распозна- 
ются геометрической системой распознавания. Пусть в каждый момент УС 
совершает некоторое действие, номер которого можно распознавать как образ 
действия. Будем распознавать, какой образ состояния распознается УС на сле- 
дующем такте после совершения действия. По указанному выше правилу, 
использующему заданное число повторений М, будем в каждой клетке таб- 
лицы БЗ формировать образ результата. Образ результата, соответствующего 
определенной клетке таблицы БЗ, будет сформирован только после М попа- 
даний в одну и ту же ситуацию, соответствующую этой клетке таблицы. Если 
АКА попал в данную ситуацию более М раз, то в данной клетке таблицы БЗ 
появляется указание на сформированный образ результата. Поскольку у нас 
это один из шести образов, то мы образ результата кодируем номером от 1 до 6, 
при этом этот номер совпадает также с величиной эмоциональной оценки этого 
образа результата. Для графического изображения БЗ удобно кодировать 
номер образа результата, цветом или оттенком серого. Постепенно БЗ напол- 
няется знаниями. На рис. 6.8 показан пример такой БЗ в состоянии, когда она 
частично заполнена, эмпирическими знаниями. Можно видеть, что не во всех, 
но в некоторых столбцах БЗ отражены эмпирически найденные УС знания, 
соответствующие свойствам данного ОУ. В данной прикладной системе знания 
в БЗ могут только накапливаться, корректироваться, но не могут стираться 
из БЗ. Поэтому столбец БЗ в текущий момент может быть либо пуст, либо 
иметь одно элементарное знание (содержать одну заполненную клетку), иметь 
несколько заполненных клеток, либо быть полностью заполненным знаниями. 

Столбец БЗ, соответствующий некоторому образу условия, может быть 
пустым по следующим причинам: либо ОУ еще ни разу не оказывался в этой 
ситуации, либо неправильно распознал данную ситуацию, либо попадал в эту 
ситуацию и совершал разные действия, но еще ни разу не совершил М одина- 
ковых действий, в результате чего УС не выявила закономерности в поведе- 
нии ОУ. Наконец, при наличии «няньки» — внешней системы управления, УС 
не накопит своих знаний, если в этой ситуации решения принимала не сама УС, 
а ее «нянька». В рассматриваемом примере в системе имелось 40 образов, при 
попадании в которые решения принимала не сама УС ААУ, а внешняя система 
управления. Это те ситуации, когда АКА оказывался за пределами диапазонов 
[2(® ть; Ф(Юшах| и/или [Ф'(шш; Ф (0) һах|. Эти столбцы так и останутся пу- 
стыми в БЗ. Это наглядное подтверждение тому, что если у живого организма, 
есть нянька, которая его опекает, то он так и не научится самостоятельно 
принимать решения в соответствующих ситуациях. 


6.1.3. Принятие решений 


База Знаний — пустая, частично или окончательно заполненная — позволяет 
принимать решения в соответствии с целевыми функциями «выживание» 
и «накопление знаний». Цели эти противоречивы в следующем смысле. 
Накопление знаний требует их активного поиска, важным элементом ко- 
торого является тем или иным способом организованный случайный выбор, 
результат которого мало или совсем не предсказуем. УС специально совершает 
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действие с непредсказуемым результатом, чтобы увидеть этот неизвестный ей 
ранее результат, сделать его известным и предсказуемым в дальнейшем. Если 
он окажется плохим, то в дальнейшем УС будет его осознанно избегать. Если 
он окажется хорошим, то УС будет к нему осознанно стремиться. Тем самым, 
работая на цель накопления знаний, УС совершает пробные действия по неко- 
торому плану, например случайно. Очевидно, что такое исследование (совер- 
шение случайных действий) несет управляющий системе риск направить ОУ 
в плохие состояния, неприятные, вредные, опасные, в том числе крайне опас- 
ные, т. е. противоречащие цели выживания. Тем не менее, не накопив знания, 
не исследовав возможно большей области в признаковом пространстве, УС 
не сможет управлять, принимая близкие к оптимальным решения, не сможет 
направлять ОУ в наилучшие состояния, не сможет справиться с опасными 
активными воздействиями со стороны среды. Поэтому УС должна совершать 
пробные случайные воздействия с исследовательскими целями, но она должна 
иметь некоторую разумную стратегию принятия решений с целью выживания. 

В свою очередь, целевая функция выживания требует совершать такие 
действия, которые с наибольшей вероятностью будут переводить ОУ в состоя- 
ния, наилучшие из возможных в текущей ситуации. Это должны быть макси- 
мально определенные действия, с максимально определенным и максимально 
положительным результатом, т.е. действия, переводящие ОУ в заранее из- 
вестное и максимально благополучное состояние. Здесь стратегия выбора оче- 
видна. Неопределенность может возникнуть только в случае, когда известно 
несколько разных действий, приводящих к равноценным по эмоциональной 
оценке результатам. В этом случае можно положиться на случайный выбор 
из равнозначных вариантов. 

Проблема, состоит в выработке стратегии принятия решений при наличии 
двух противоречивых целевых функций: накопления знаний и выживания. 
Мы видим и используем несколько возможных стратегий, выбор которых для 
определенного ОУ зависит от конкретных прагматических условий. 


Стратегия 1 — разделение режимов обучения и управления 


Это наиболее простая стратегия принятия решений, применимая тогда, когда 
в жизни ОУ можно специально выделить периоды, в течение которых пред- 
почтение отдается целевой функции «накопление знаний» (период обучения), 
в отличие от остальных периодов, когда доминирует цель «выживание» (пе- 
риод управления). Эта стратегия оправдана во многих случаях. Например, 
в рассматриваемом случае с АКА именно эта стратегия была потребована 
заказчиками системы, поскольку они могли указать такие отрезки времени, 
в которые УС могла работать в режиме «обучения», и отрезки времени, 
в которые УС должна была работать в режиме «управления». Режим «управ- 
ления» предполагалось назначать тогда, когда на борту АКА должны были 
проводиться наблюдательные эксперименты с научной аппаратурой, и от 
АКА требовалось максимально точное наведение на цель наблюдения. В это 
время любые пробные случайные воздействия актуаторов нежелательны. УС 
должна только совершать максимально точные управляющие воздействия, 
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чтобы стабилизировать положение АКА. Заметим, что такая стратегия явля- 
ется обычной для подавляющего большинства технических систем управления. 
Вначале систему управления обучают, и только после того как она начнет 
демонстрировать требуемое качество управления, систему управления ставят 
на рабочий объект и позволяют ей управлять. Так обстоит дело в нечетких 
системах управления, которые обучают заранее. Предварительного обучения 
требуют нейронные сети и экспертные системы. Более того, в жизни живых 
организмов тоже можно усмотреть некоторые признаки такой стратегии. Так, 
у развитых животных детство каждого индивида обычно проходит в семье, 
целенаправленно обучающей новорожденный организм многим навыкам, ко- 
торые понадобятся ему во взрослой жизни (в режиме «управления»). Да 
и в жизни взрослых организмов можно видеть периоды обучения — игры, 
проявления любопытства, исследование территории и т. п. В жизни человека 
явно выделяются фазы, когда преобладает целевая функция обучения (учеба 
в учебном заведении), и фазы управления (когда после сдачи экзаменов вы- 
пускнику доверяют управлять реальными объектами). 

В соответствии с этой стратегией, организуем в работе УС два режима — 
обучения и управления. 


Режим обучения. Алгоритм обучения можно строить с расчетом на, имею- 
щуюся априорную информацию либо на ее отсутствие. Если всякая априорная 
информация о свойствах объекта управления отсутствует, то самый простой 
алгоритм поиска может состоять в равновероятном переборе поискового 
пространства. В данном случае поисковым пространством является все 
пространство БЗ, представленной в табличной форме (рис. 6.8). В первом 
приближении будем полагать, что АКА попадает в то или иное состояние, 
описываемое «образом условия» — столбцом БЗ, случайно, и от УС требуется 
выяснить знания, соответствующие этому столбцу, пользуясь некоторым 
алгоритмом поиска, применяемым индивидуально в каждом столбце БЗ. 

Итак, не умножая предположений, будем полагать, что все столбцы неза- 
висимы, и будем говорить об одном столбце, полагая, что эти рассуждения 
и алгоритм применяются для каждого из столбцов отдельно. 

Алгоритм поиска знаний в столбце зависит от цели поиска. Отметим, что 
в столбце должна быть информация о том, какой образ результата будет 
получен при совершении каждого из возможных действий, а не только оценка 
этого образа. Предполагается также, что у каждого образа результата, имеется 
своя эмоциональная оценка. Пусть эти оценки нам известны заранее (в общем 
случае они при отсутствии априорной информации полагаются нейтральными, 
а затем корректируются). Целью поиска знаний может быть, например, 
выявление всех образов результатов, соответствующих всем действиям. В этом 
случае алгоритмом поиска знаний в столбце может быть просто случайный 
выбор действий. Действие выбирается случайно, совершается, ОУ и среда 
реагируют на него, отклик распознается в виде образа результата и номер 
этого образа записывается в данную клетку столбца. Тут же можно записать 
и эмоциональную оценку этого образа результата. Такой алгоритм поиска 
дает в итоге представление обо всех образах результата, соответствующих 
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всем действиям, т.е. УС получает представление о том, в какое состояние 
она может перевести ОУ из каждого из распознаваемых ею исходных 
состояний, независимо от эмоциональных оценок состояний. Пользуясь 
такой БЗ, управляющая система сможет управлять объектом с любой целью: 
переводить его в нужные состояния, например в состояния с максимальными 
оценками, или в состояния с минимальными оценками и т. п. При этом знания 
не утратят своей ценности, если изменятся эмоциональные оценки состояний. 
Оценки образов можно изменить мгновенно по любому поводу, связанному 
с целеполаганием, а знания о том, каким способом можно переходить из одного 
состояния в другое — это очень ценные и труднодобываемые знания, которые 
и сохраняются в такой БЗ. Для иллюстрации пример из жизни. Примером БЗ, 
содержащей информацию о возможностях перехода из состояния в состояние, 
является карта метрополитена. Имея ее в руках, всегда можно принять 
решение о том, как добраться с любой исходной станции к любой другой 
станции, если она вдруг станет для вас желанной (т. е. приобретет высокую 
положительную оценку). И эту карту не надо менять каждый раз при смене 
исходной или целевой станции, или эмоциональной оценки станций. 

При всей разумности такой Базы Знаний далеко не во всех технических 
системах можно найти ее аналог. Обычно в Базах Знаний вместо образа 
результата указывают сразу оценку результата. Это делают в предположении, 
что а) целевое состояние будет всегда одно и то же, и б) оценки состояний 
не будут меняться. Определенный аналог таких Баз Знаний представляют 
системы «обучения с подкреплением» (теіпѓіогсетепё Іеагпіпр;), а также нейрон- 
ные сети. Поскольку такую Базу Знаний построить существенно легче, чем БЗ 
с указанием образов результатов, то их применение на практике оправданно, 
если выполняются указанные условия. Кроме того, ориентация на оценки 
конечных результатов, в случае, если это единственно важная характеристика 
состояний ОУ, может быть использована для организации целенаправленной 
процедуры поиска. 

Рисунки 6.8 и 6.9 демонстрируют вариант Базы Знаний, в которой номер 
образа результата совпадает с номером его эмоциональной оценки, так как они 
определяются по одному и тому же правилу геометрической системой распо- 
знавания. На рис. 6.8 БЗ показана в промежуточном состоянии ее заполнения, 
а на рис. 6.9 — в конечном состоянии заполнения. Эта БЗ заполнялась методом 
равновероятного случайного поиска. 

Можно видеть, что в БЗ окончательно заполнены все столбцы, кроме 
тех столбцов-образов исходного состояния, в которых решения принимает 
не УС ААУ, а внешняя система управления. Попав в любой заполненный стол- 
бец, УС может найти действия, которые переводят ОУ в состояния с разными 
эмоциональными оценками, т. е. система управляема. 


Режим управления. В режиме принятия решений (т. е. управления с целью 
выживания) УС может выбирать действие, которое переведет АКА в лучшее 
результирующее состояние из возможных в данном исходном состоянии. 
Пример работы УС в режиме управления показан на рис. 6.10. Изображен 
фрагмент, когда УС ААУ, распознав, что рассогласование угла стало слишком 
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Рис. 6.9. База Знаний, заполненная методом равновероятного случайного исчерпы- 

вающего поиска, в ее конечном состоянии. Плотностью окраски образа результата 

кодируется величина его эмоциональной оценки: в данном случае УС должна на- 
правлять объект управления в состояния, помеченные наиболее темным тоном 


большим, решила аккуратно подтолкнуть АКА верх с помощью точно подо- 
бранного по БЗ импульсного воздействия, отраженного на нижнем графике. 
Видно, что после этого АКА начал возвращаться на место. 


Угол рассогласования 


Номер действия 


Рис. 6.10. Фрагмент процесса управления с помощью Базы Знаний, 
показанной на рис. 6.9 
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Рис. 6.11. Два последовательных фрагмента, (а) и (6) эволюции, на которых можно 

видеть, как УС ААУ выводит АКА из состояния сильного возмущения. Вверху — 

угол рассогласования, в середине — угловая скорость АКА, внизу — управляющие 
воздействия 


На рис. 6.11 показано, как УС выводит АКА из очень плохого состояния, 
в которое АКА был введен сильными случайными воздействиями. Сильное 
возмущение, которому подвергся АКА (первая четверть отрезка времени, 
показанного на рис. 6.11 (а)), постепенно преодолевается сначала энергичными 
действиями актуатора (рис. 6.11 (а)), а потом и очень тонкими воздействиями 


(рис. 6.11 (6)). 


Данная стратегия управления с раздельными режимами обучения и управ- 
ления имеет свои достоинства, недостатки и особенности. 


Достоинства. УС знает все про каждое из возможных действий в каж- 
дом из возможных состояний, в которые АКА может попасть сам или с помо- 
щью неожиданного внешнего воздействия. 

Из такой БЗ можно извлечь полный детерминированный «закон управле- 
ния» (см. ниже). 
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Недостатки. Требуется большое (относительно других стратегий) время 
для окончательного заполнения БЗ. 

Большинство знаний являются избыточными: 

а) имеется много исходных состояний, в которые АКА с большой вероят- 

ностью никогда не попадет; 

б) УСзнает не только о действиях, переводящих АКА в лучшие состояния, 

но и обо всех действиях, переводящих АКА в плохие состояния. 
Если цель управления никогда не меняется (например, от системы всегда 
требуется только одно — держать угол рассогласования в нуле), то эти знания 
являются лишними. 

Такая стратегия обучения имеет также недостаток, который можно на- 
звать «эффектом жесткой методики обучения». Проявляется он в том, что 
после обучения способом случайного выбора действий и перехода в режим 
управления УС демонстрирует вначале не очень высокое качество управления 
(выбираются не самые лучшие действия, и АКА не очень хорошо стабилизиру- 
ется), которое постепенно в процессе адаптации улучшается и затем выходит 
на хороший уровень. Причина эффекта жесткого обучения состоит в том, что 
при случайном выборе действий в режиме обучения, УС очень резко дергает 
АКА, не считаясь с ее текущим положением и целевым состоянием. В резуль- 
тате АКА все время находится в «дерганом, нервном» состоянии и проявляет 
соответствующие свойства. Когда же УС переходит в режим управления, УС 
начинает обращаться с АКА мягко, выбирая преимущественно слабые воздей- 
ствия, потому что у АКА нет особых причин совершать резкие движения. 
В благодарность за аккуратное обращение АКА демонстрирует несколько 
иные свойства — возможно, что в этом случае заметно не проявляются высокие 
гармоники в спектре колебаний осцилляторов, и т. п. Здесь в материальной 
форме проявляется житейская мудрость: «как аукнется, так и откликнется». 
Обращайтесь с учениками вежливо, и они будут демонстрировать вам свои 
лучшие качества. 


Адаптивные свойства 


Основное свойство управления с помощью системы ААУ — адаптивность 
проявляется в этом варианте системы в следующих отношениях. 


А. Начальное обучение — УС, не имея априорных знаний о свойствах за- 
данного АКА, находит способ управления им, в этом проявляется способность 
к начальной адаптации. 


В. Изменение БЗ при изменении свойств АКА. При раздельном способе 
управления для такого переобучения лучше включать режим обучения. Могут 
изменяться различные параметры АКА — его масса, момент инерции, коэф- 
фициенты упругости осцилляторов и т. п. УС автоматически переучит свою БЗ 
соответственно новым свойствам (пример на рис. 6.12). 


С. При изменении свойств внешней среды УС ААУ адаптируется к новым 
условиям. Например, может измениться действующий на АКА возмущающий 
момент. 
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Рис. 6.12. БЗ автоматически адаптируется к изменившемуся моменту инерции АКА 


Р 


р. Некоторые адаптивные свойства в таком варианте системы могут проис- 
ходить и без переключения режимов обучения / управления. Напомним, что 
разделение режимов введено затем, чтобы исключить поисковые случайные 
управляющие моменты. Однако если некоторые закономерности можно вы- 
явить в результате анализа уже накопленных данных, не производя случайных 
пробных действий, то такие найденные закономерности можно вводить и в 
режиме управления. Мы использовали некоторые такие возможности в данном 
варианте системы. 


Получение эмпирического детерминированного 
закона управления 


Заполнение всего поискового пространства Базы Знаний эмпирическими зна- 
ниями позволяет легко получить детерминированный закон управления для 
данного ОУ, который по существу заменяет собой аналитически выводимый 
закон управления (рис. 6.2), получаемый обычно с большим трудом. Для 
получения эмпирически найденного детерминированного закона управления 
следует в каждом столбце БЗ найти результирующий образ с максимальной 


и" 


Номер образа состояния ОУ 


Номер действия 


Рис. 6.13. Пример эмпирически найденного детерминированного 
закона управления АКА (на модели) 
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оценкой. На рис. 6.13 показан пример эмпирически найденного детерминиро- 
ванного закона управления для заданного объекта, управления — АКА. 

Такой детерминированный закон управления может быть зашит в па- 
мять БЦВМ в компактной форме простой таблицы. Он позволяет управлять 
АКА с вполне приемлемым качеством. Однако управление по этому закону 
лишает УС адаптивных свойств. Если свойства АКА изменятся, качество 
управления сразу ухудшится. 

Рассмотренная стратегия 1 соответствует наиболее тяжелому случаю от- 
сутствия априорной информации о свойствах ОУ, отраженных в БЗ. 


Стратегия 2 — принятие решений 
с использованием выводимых знаний 


Возьмем разрез Базы Знаний, соответствующий столбцу БЗ — одному образу 
условия, содержащему образы результата, в которые АКА переходит в ре- 
зультате совершения всех возможных действий. Рассмотрим эмоциональные 
оценки этих образов результата. УС должна стремиться найти в первую оче- 
редь образы результата, которые имеют максимальные оценки. Изобразим ве- 
личины этих оценок образов результатов в виде некоторой кривой (рис. 6.14), 
соответствующей взятому столбцу. 

При попадании АКА в данный столбец, УС при этой стратегии должна так 
принимать решения, чтобы найти максимум этой кривой. Выбор решения при 
этом сводится к задаче поиска максимума кривой оценок. Можно использо- 
вать разные соответствующие методы. Например, метод градиентного спуска. 
Пусть управляющая система, начав со случайного пробного воздействия, в сле- 
дующий раз выбирает решение, лежащее рядом с предыдущим, и пытается 
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Рис. 6.14. Столбец Базы Знаний скрывает неизвестную функцию оценок образов 
результатов, максимум которой надо выявить в процессе взаимодействия с объектом 
управления 
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Рис. 6.15. Принятие решений с целенаправленным поиском 


понять, в каком направлении функция возрастает (куда направлен градиент 
функции). При следующем попадании в данный столбец выбирается действие, 
примыкающее к предыдущим с той стороны, где функция должна возрастать 
(здесь мы имеем не градиентный «спуск», а градиентный «подъем»). Так по 
порядку исследуются действия, оценки которых «поднимаются» на вершину 
холма исследуемой кривой (рис. 6.15). Организуется «правило останова», со- 
гласно которому поиск прекращается, например, тогда, когда возрастание 
оценок сменяется их уменьшением, и УС полагает, что нашла лучшее дей- 
ствие для данной ситуации. Если принять некоторые меры для того, чтобы 
избежать остановки на локальных максимумах, то это вполне практичный 
метод принятия решений. 

При такой стратегии УС осуществляет обучение и управление в одном 
процессе. Хотя УС и совершает пробные действия, но эти пробные действия 
выбираются не случайно, а на основе прогноза, указывающего, где следует 
искать действие, которое должно давать лучшие результаты, чем прежде 
известные действия. Это обеспечивает такой процесс обучения, когда каче- 
ство управления постепенно повышается вместе с накоплением знаний. Когда 
срабатывает «правило останова» поиска (например, когда прогноз начинает 
расходиться с фактическим результатом), т.е. когда лучшее действие ста- 
новится известным УС, и следующие поисковые действия приводят только 
к ухудшению качества управления, процесс поиска в данном столбце пре- 
кращается, и УС начинает пользоваться только уже известными лучшими 
действиями, отказываясь от риска и возможности обнаружения еще более 
хороших действий. Когда в каждом из посещаемых столбцов будет найден 
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глобальный максимум оценки (уверенность в том, что это глобальный, а не ло- 
кальный максимум, опирается на принятый метод поиска), УС полагает свое 
«любопытство» удовлетворенным и далее только пожинает плоды своего «вос- 
питания» — направляет АКА в хорошие состояния, «наслаждаясь» высокими 
эмоциональными оценками. БЗ при этом перестает пополняться. Очевидно, 
что при такой стратегии принятия решений БЗ оказывается заполненной 
далеко не полностью, но знания, которые содержит БЗ, существенны для 
управления. Не все столбцы содержат данные, а только те, которые посе- 
щались объектом управления. Каждый из непустых столбцов тоже заполнен 
не полностью, а указывает только на действия, приводящие к лучшим резуль- 
татам, и действия, отражающие поисковый процесс приближения к данным 
точкам с той стороны, с которой случайно начался поиск. Если не произойдет 
никаких изменений свойств АКА или среды, то этих знаний окажется вполне 
достаточно для управления. Если произойдет изменение свойств АКА или 
среды, то данные в БЗ подвергнутся коррекции и процесс поиска новых знаний 
может быть продолжен. Если АКА попадет в состояние, в которое ранее 
не попадал, то в данном столбце начнется процесс обучения. 

Данная стратегия принятия решений ускоряет обучение БЗ, высокое каче- 
ство управления достигается быстрее. 

Еще раз подчеркнем, что данная стратегия принятия решений использует 
формально выведенные новые знания — это предположение о том, что искомая 
кривая оценок будет возрастать в найденном направлении. Если говорить об 
априорной информации, то она здесь используется только в том смысле, что 
используется основанное на предыдущем опыте предположение об определен- 
ной гладкости кривой оценок. 


Стратегия 3 — использование априорной информации 
в процессе принятия решений 


Рассмотрим возможности использования более очевидно выраженной априор- 
ной информации при построении Базы Знаний и стратегии принятия решений. 
Здесь применимы различные решения, основанные на априорной инфор- 
мации, полученной, например, в предварительных пробных экспериментах 
на моделях. 

Так, можно заметить, что трехмерная База Знаний, в которой показаны 
оценки образов результатов, имеет для данного ОУ вид ориентированного 
по диагонали пространства БЗ «холма», разделенного вертикальными «овра- 
гами» (например, рис. 6.9). Безусловно, такая закономерность видна только 
при данной принятой структуре представления данных в БЗ, и, возможно, 
что при некоторой иной структуре представления знаний выявились бы иные 
и более интересные закономерности. Заменяя этими наблюдениями отсутству- 
ющую эволюционную оптимизацию управляющих систем данного вида, мы 
имеем право использовать выявленные закономерности в качестве априорной 
информации при принятии решений. 

Возьмем описанный выше метод на основе градиентного спуска (подъ- 
ема) и сделаем его более эффективным, используя указанную априорную 
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информацию. Изменим способ выбора начальной точки для исследования 
столбца БЗ. Примем на основе априорной информации следующее предпо- 
ложение: в соседних столбцах БЗ оценки образов результатов имеют близкие 
значения. Основываясь на этом предположении, для пустого или заполненного 
только низкими оценками столбца БЗ в качестве начальных пробных действий 
можно выбирать действия с номерами, которые близки номерам действий, 
приводивших к образам с хорошими оценками в соседних столбцах. Если же 
высокие (или максимальные) оценки найдены в двух соседних столбцах — 
слева и справа от исследуемого, то вполне возможно, что в искомом столбце 
высокую оценку (или близкую к ней) можно будет обнаружить при помощи 
линейной интерполяции: искомое действие с наибольшей вероятностью будет 
лежать на пересечении столбца и прямой линии, соединяющей известные 
максимумы ближайших соседних столбцов. Далее, начиная с этой найденной 
начальной точки, продолжаем поиск градиентным методом. Такое использовал 
ние априорной информации позволяет значительно ускорить процесс обучения 
за счет сокращения пространства поиска. 

На рис. 6.16 показана БЗ, полученная таким способом (справа вверху), 
временной ход угла рассогласования (слева вверху), достигаемый управлением 
с помощью этой БЗ, и управляющие воздействия (слева внизу). 

Можно видеть, что БЗ заполнена далеко не полностью, но при этом обеспе- 
чивается высокое качество управления. Следовательно, при данной стратегии 
высокое качество управления достигается быстрее. 
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Рис. 6.16. Скриншот с экрана моделирующей программы, показывающей процесс 
управления с использованием описанной стратегии градиентного спуска с использо- 
ванием априорной информации (разработка, М. В. Караваева) 
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Рассмотрим другой вариант использования априорной информации. Пусть 
после некоторого числа случайно принятых решений в БЗ появляется неко- 
торое множество эмпирических знаний. Выберем лучшие из них в каждом 
из представленных столбцов и аппроксимируем их полиномом. Будем полагать 
этот полином приближением к линии «хребта», около которого располагаются 
искомые максимумы. Будем считать, что положение максимума в данном 
столбце можно рассматривать как случайную величину с нормальным зако- 
ном распределения, математическое ожидание которой лежит на пересечении 
данного столбца, с линией полинома. Оценив по данным из столбца дисперсию, 
можно принимать решения в соответствии с этим распределением. Таким об- 
разом, УС будет осуществлять целенаправленный поиск максимума, опираясь 
на формальный вывод новых знаний, полученный из старых знаний. При 
этом для формального вывода используется все пространство Базы Знаний — 
и столбцы, и строки. Новыми, выведенными знаниями здесь будут являться: 
а) выведенный полином, пересекающий все столбцы — прогнозируемое управ- 
ляющей системой положение наилучших из искомых знаний и б) пробное 
действие, выбранное в соответствии с рассчитанным средним и принятым 
распределением. При этом выбранное таким способом пробное действие будет 
носить характер прогноза, который еще следует проверить. Выбирая и со- 
вершая это действие, опирающееся на прогнозируемую закономерность, УС 
получает реальный отклик среды, который либо подтверждает ее прогноз, 
либо не совпадает с ним. Достоверные результаты записываются в БЗ и могут 
использоваться для коррекции найденных закономерных свойств БЗ (знаний 
над знаниями). В данном случае может корректироваться полином, прогно- 
зирующий положение искомых знаний, а также дисперсия распределения 
данных в столбцах. На рис. 6.17 показана БЗ с выделенным на ней полиномом. 


Действия 


Образы состояния 


Рис. 6.17. База Знаний с полиномом, предсказывающим наиболее вероятное поло- 
жение лучших знаний (результаты дипломной работы Б. М. Магомедова) 
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Рис. 6.18. База Знаний, полученная с использованием процедуры формального 

вывода знаний над знаниями, прогнозирующей положение искомых знаний и на- 

правляющей поиск. Скриншоты с экрана моделирующей программы, разработанной 
Б. М. Магомедовым 


На рис. 6.18 представлена БЗ, заполняемая с использованием описанной 
стратегии принятия решений, в двух стадиях ее заполнения. Видно, как 
постепенно корректируется полином — формально выведенное УС знание 
о свойствах БЗ, прогнозирующее и направляющее поиск эмпирических знаний. 
При этом БЗ, заполненная всего на несколько процентов, содержит знания, 
существенные для управления, и может обеспечить управление с высоким 
качеством. 

В этой стратегии мы видим, что априорное знание может помочь в выборе 
правильной стратегии принятия решений. 


Стратегия 4 — формирование Базы Знаний в результате 
эволюционного поиска 


В определенном смысле задача принятия решений состоит в оптимизации 
«закона управления» на заданном пространстве Базы Знаний с ее неизвест- 
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ным заранее содержимым, определяемым свойствами представленного объ- 
екта управления в данной среде, с одновременным «наказанием» поисковой 
системы за принятие неоптимальных решений. Поэтому, согласно первой части 
такой постановки задачи, для принятия решений можно применять различные 
методы поисковой оптимизации. Мы предполагаем, что хорошие результаты 
здесь может дать метод автоматной оптимизации коллективом конечных ав- 
томатов, если применить методики, описанные, например, А. Н. Рапопортом 
[22]. Однако сейчас мы рассмотрим некоторые возможности, предоставляемые 
таким методом эволюционной оптимизации, как генетические алгоритмы. 


Генетические алгоритмы 


На каждое живое создание, преуспевшее 
в отыскании опоры в жизни, 
приходятся миллиарды тех, кто погиб. 


Д. В. Н. Салливан. 


Существовало несколько подходов к моделированию естественного эволю- 
ционного отбора. Одни из первых соображений высказывались А. Тьюрингом 
еще в 1940-х годах, когда он определил три основных подхода, в рамках кото- 
рых возможно использование методов поиска для автоматического создания 
«разумной» компьютерной программы. Первый подход состоит в применении 
поиска в пространстве чисел, представляющих компьютерные программы- 
кандидаты. Этот подход отражает предложенные самим Тьюрингом идеи в об- 
ласти логического обоснования вычислительных алгоритмов. Второй подход 
Тьюринг описал как «культурный» поиск, который опирается на знания экс- 
пертов. Этот подход во многом соответствует идеям современных экспертных 
систем. Третий подход Тьюринг определил как «генетический или эволю- 
ционный поиск, при котором отыскивается комбинация генов, а критерием 
является “значение выживания”». 

В данном случае нам интересен последний подход, поэтому опишем его 
немного подробнее. Суть этого метода, названного «генетическими алгорит- 
мами» (ГА), состоит в следующем. Пусть требуется найти экстремум (далее — 
максимум) некоторой неизвестной функции, определенной на пространстве 
нескольких параметров. Эта функция в методе ГА называется «фитнес- 
функцией» или «функцией приспособленности индивидов» (рис. 6.19). Пусть 
полный перебор значений всех параметров (исчерпывающий поиск) неприем- 
лем. Вычислим значения искомой функции для некоторого множества слу- 
чайно выбранных вариантов пробных значений параметров. Это множество 
в ГА есть «население», или «популяция индивидов», а каждый элемент этого 
множества есть «индивид». Каждое конкретное значение отдельного пара- 
метра у всякого «индивида», представленное в некоторой системе кодировки, 
есть «ген». Отберем несколько вариантов, давших наибольшие значения функ- 
ции, и разобьем их произвольно на пары. Из каждой пары образуем новую 
пару вариантов путем обмена значениями некоторых параметров. Например 
(в двумерном случае), из пары со значениями параметров (21,01) и (22,7) 
получаем новую пару (21,102) и (22,101). Эта операция называется «скрещива- 
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Рис. 6.19. «Индивиды», характеризуемые совокупностью своих значений парамет- 
ров — «хромосомами», «население» (популяция индивидов) и искомая максимизиру- 
емая «функция приспособленности индивидов» 


нием». Затем случайным способом немного изменяем значения некоторых пал 
раметров в новой паре. Эта операция называется «мутацией». Множество всех 
новых индивидов есть новая «популяция», т.е. новое множество наборов проб- 
ных значений параметров — «индивидов». Рассчитываем для них значения 
искомой функции и повторяем процедуры скрещивания и мутации до тех пор, 
пока не приблизимся с заданной точностью к искомому экстремуму функции. 
Правило останова здесь четко не определено (его устанавливают по ситуации), 
однако в теории ГА показано, что метод позволяет с заданной точностью отыс- 
кивать глобальный экстремум. Но для нас важна также способность ГА отыс- 
кивать экстремум даже изменяющейся со временем исследуемой функции. 
Этот метод многокритериальной оптимизации получил название «генети- 
ческие алгоритмы» потому, что он имеет сходство с процессом эволюционного 
развития видов биологических организмов, обеспечиваемого хромосомным 
механизмом передачи и изменения наследственности. Известно, что отдельные 
свойства организма закодированы в его генах, которые объединяются в парный 
(диплоидный) набор хромосом. Совокупность генов составляет генотип, кото- 
рый и определяет внешний вид и свойства организма, т.е. его фенотип. При об- 
разовании потомка, от двух особей генотип потомка формируется в результате 
объединения непарных (гаплоидных) наборов хромосом половых клеток роди- 
телей в один диплоидный набор хромосом потомка. Здесь идет обмен не от- 
дельными генами, но целыми хромосомами. Когда же происходит образование 
половых клеток потомка, то его хромосомы образуются в результате скрещи- 
вания пары родительских гаплоидных хромосом, при котором происходит уже 
обмен отдельными участками хромосом. В результате в отдельной хромосоме 
половой клетки потомка часть генов взята от одного родителя, а часть — 
от другого. Кроме скрещивания имеют место также мутации — случайные 
«точечные» изменения в хромосомах половой клетки потомка. Мутации об- 
разуются под влиянием различных факторов, например радиации. Таким 
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Рис. 6.20. Примеры кодировки «хромосомы». Показан пример 
кодирования числа 105, а также два варианта кодирования пары (233, 105) 


образом, потомок наследует и «смешивает» в себе отдельные свойства своих 
родителей (благодаря объединению их хромосом), а также формирует в своих 
половых клетках новые по составу хромосомы, получающиеся в результате как 
комбинаций генов родителей, так и мутаций, и передает их далее уже своим 
потомкам. В целом этот механизм обеспечивает пробное изменение свойств 
потомка, а значение его «функции выживания» определится тем, насколько 
удачными для выживания оказались свойства этого конкретного организма. 

В ГА значение каждого признака в некоторой кодировке уподобляется 
одному гену, а вся совокупность закодированных значений признаков инди- 
вида соответствует его хромосоме. «Гены», из которых состоит «хромосома», 
кодируются некоторыми символами. Часто пользуются бинарным представ- 
лением (рис. 6.20), а также восьмеричным, десятичным, шестнадцатеричным, 
и символьным представлениями. Выбор типа кодировки в ГА является одним 
из центральных моментов при решении прикладных задач, так как кодировка 
определяет возможности стохастических операторов, их сложность и скорость 
вычислений. 

То свойство организма, которое мы хотим максимизировать, в ГА назы- 
вается «функцией приспособленности». Например, эта функция характери- 
зует удачность «Ффенотипа» (конструкции) индивида, его приспособленность 
к условиям, в которых он существует, и мы заранее не знаем, как эта 
приспособленность зависит от значений параметров — от его хромосомы. 
Именно «функцию приспособленности» индивида мы и должны оптимизи- 
ровать, т.е. найти индивида с наиболее удачными значениями параметров. 
Создается множество — «популяция индивидов» со случайными значениями 
параметров, определяющими их «приспособленность». Отбирается подмноже- 
ство наиболее удачных пар — наиболее приспособленных индивидов. Пары 
удачных индивидов используются для порождения «потомков», хромосомы 
которых образуются из хромосом «родителей» путем их скрещивания — об- 
мена частями хромосом, а затем полученные хромосомы потомков случай- 
ным образом мутируются. Полученные потомки в результате скрещивания 
хромосом наследуют положительные качества родителей (в смысле заданной 
функции приспособленности), а в результате мутаций получают некоторые 
случайные изменения своих качеств. С точки зрения теории стохастической 
оптимизации, мутации обеспечивают относительно сильное изменение свойств 


306 Глава 6. Практические приложения 


А 
то“ о[ојя [1 оа 0] [1[0јоја[1 | 
———— 
оү 1[1]0] 10 110] [111010 | 
> > 
019100111 КР 
ЧТо 1[11ојя[о 
> 


Рис. 6.21. Пример оператора скрещивания (кроссовера) 


организма и выход из локальных экстремумов оптимизируемой функции (при- 
способленности организма), а скрещивание обеспечивает более тонкие измене- 
ния, сопровождающиеся схождением к экстремуму функции. Преобразования 
хромосом, осуществляемые при скрещиваниях и мутациях, в ГА называются 
стохастическими операторами (рис. 6.21). Имеется несколько их разновидно- 
стей, на которых мы не будем здесь останавливаться. Этими операторами опре- 
деляется, какие гены и в каком порядке переставляются, с какой вероятностью 
и в каких местах хромосомы происходят ее случайные изменения и т. п. Далее 
из множества полученных потомков отбираются наиболее удачные, т. е. наи- 
более приспособленные, и весь процесс повторяется заново. Мы не будем 
описывать здесь типичную схему работы ГА и отсылаем читателя, например, 
к работе [44]. В результате процесса эволюционного отбора, реализуемого в ГА, 
последовательности потомков становятся все более и более удачными — их 
«функция приспособленности» максимизируется. 

Относимые к стохастическим поисковым эвристическим методам одно- 
и многокритериальной оптимизации, ГА применимы для более широкого 
класса целевых функций, чем большинство стандартных методов, в частности 
метод градиентного спуска. Большинство традиционных методов оптимизации 
оперирует с одним аргументом целевой функции, вычисляя новое значение ар- 
гумента на основе предыдущего его значения. ГА, напротив, оперирует с неко- 
торым множеством аргументов и не использует свойства целевой функции. 

Необходимо обратить внимание на то, что ГА являются мощным сред- 
ством автоматической поисковой оптимизации, которое может использоваться 
при конструировании самых различных механизмов, в том числе различных 
устройств и систем космических аппаратов. 


База Знаний системы управления 
на основе генетического алгоритма 


Очевидно, что алгоритм ААУ не является оптимальным с точки зрения 
использования ресурсов БЦВМ — объема памяти и быстродействия. Несмотря 
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на то, что алгоритм управления ААУ достаточно быстродействующий, 
целесообразно видеть пути оптимизации управляющей системы ААУ для 
случаев, когда требуется увеличить количество образов, количество действий 
или другие множества информационных объектов, занимающих память 
и процессор БИВМ. 

В системе автономного адаптивного управления «Пилот», используемой 
для адаптивной стабилизации углового движения АКА, многие подсистемы 
могут быть построены и оптимизированы с помощью ГА. Мы находим, что 
непроизводительные расходы вычислительных ресурсов наиболее велики в БЗ 
при использовании полного перебора как стратегии обучения. Покажем, как 
ГА могут использоваться для построения и оптимизации Базы Знаний и подси- 
стемы принятия решений [43, 93]. При этом в целом будем оставаться в рамках 
методологии ААУ. 

Для того чтобы нагляднее показать работу ГА по оптимизации БЗ, вос- 
пользуемся описанной выше табличной формой представления БЗ. Стратегия 
поиска, которую реализует УС при обучении, касается в основном способа 
заполнения каждого отдельного столбца БЗ. Можно говорить о том, что 
в каждом столбце БЗ реализуется свой поисковый алгоритм. При наиболее 
простом способе — случайном полном переборе, УС, попав в данный столбец, 
выбирает пробное воздействие случайным способом. 

Пусть за каждым из столбцов БЗ закреплен свой ГА. «Индивидом» будем 
полагать отдельную клетку в столбце БЗ. «Ген» есть номер действия — 
значение координаты пробной клетки. «Населению» будет соответствовать 
некоторое множество пробных клеток. «Функции выживания» соответствует 
оценка качества образа результата в данной клетке таблицы. Тем самым, 
ГА должен найти координату клетки (номер действия управляющей системы), 
в которой находится максимальное число, т. е. требуется найти номер такого 
действия УС, которое переведет АКА в угловое состояние, заданное целевой 
функцией. 

С точки зрения двух указанных выше целевых функций (обучение и вы- 
живание), при рассмотренном способе использования ГА можно организовать 
два варианта работы системы. В первом варианте можно совместить обучение 
непосредственно с процессом управления. Во втором варианте стадии обучения 
и управления можно разделять. 

Рассмотрим первый вариант. Каждый раз, когда ОУ попадает в состо- 
яние, описываемое образом, которому соответствует данный столбец, вклю- 
чается ГА, который, поддерживая заданный размер популяции, постепенно 
сосредоточивает клетки таблицы БЗ возле того номера действия, которое 
приводит к наилучшему состоянию ОУ. При этом каждая такая клетка 
(как элементарное знание УС) записывается в БЗ только после накопления 
достаточной статистической уверенности, что это не случайный результат, 
т.е. прежде, чем именно эта клетка «пропишется» в таблице БЗ, надо, 
чтобы данная ситуация при управлении АКА повторилась требуемое число 
раз. Каждый раз, когда выбирается 1-е действие, оно инициирует создание 
определенного 1-го управляющего момента, поворачивающего космический 
аппарат. 
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Результатом работы всех ГА в таком варианте является БЗ, в которой 
каждый столбец содержит не все клетки, но только популяцию клеток, число 
которых не превышает установленного предела. Принятие решений управля- 
ющей системой здесь совпадает с выбором клетки генетическим алгоритмом. 
Свойства такой системы состоят в следующем. 


® Объем БЗ сокращается во столько раз, во сколько объем популяции 
меньше размера столбца БЗ. 

® УС принимает не обязательно всегда самые лучшие из известных ей 
решений, но близкие к ним. 

• Правило останова не определено, поэтому, даже попав на экстремальную 
точку, ГА может временно упустить ее, продолжая поиск. 

® ГА будет адаптировать БЗ к изменяющимся свойствам ОУ или среды, 
что является весьма важным свойством. 


На рис. 6.22 показаны в табличной форме примеры БЗ, полученной при 
стратегии полного перебора при обучении (а), и БЗ, полученной в процессе 
работы ГА (6). 

Индивидом является одно значение из множества [0,1,..., М], где М — 
количество управляющих моментов, которые могут использоваться УС. В на- 
чале работы системы для каждого образа производится инициализация «насе- 
ления», т.е. из множества [0,1,..., М] случайным способом выбираются К эле- 
ментов, К < М. Размер населения выбирался нами методом «проб и ошибок». 
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Рис. 6.22. База Знаний системы «Пилот», полученная методом полного случайного 

перебора, (а), и более компактная База Знаний, полученная с помощью генетических 

алгоритмов (6). Яркость точек здесь пропорциональна величине оценки качества 

образов «результирующего состояния» объекта управления. Результаты получены 
Л. В. Земских 
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Программный прототип системы «Пилот» был сконструирован с исполь- 
зованием объектно-ориентированного подхода, который обеспечивает модуль- 
ность программной системы. Это позволяет вносить изменения в реализацию 
Базы Знаний без необходимости перепрограммирования всей системы цели- 
ком. Между Базой Знаний и системой управления происходит обмен только 
данными об оценке выполненных действий и данными о выбранном действии. 
Программный модуль БЗ был создан из двух классов — собственно класса, реа- 
лизующего Базу Знаний, и класса, реализующего генетический алгоритм. При 
конструировании БЗ был использован принцип контейнерной вложенности, 
когда один объект «БЗ» содержал несколько объектов типа «ГА». В программу 
изначально закладывались данные о структуре Базы Знаний — количестве 
образов и действий, которые определяли параметры инициализируемых объ- 
ектов. В частности, количество образов, существующих в системе, определяло 
количество объектов типа «ГА», а данные о количестве действий определяли 
отрезок числовой прямой, на которой производилась оптимизация. 

Возможен также другой подход к оптимизации Базы Знаний на основе ГА. 
В качестве индивида можно взять пробный «закон управления», т. е. одно- 
мерный массив данных, содержащий сведения о том, какое действие нужно 
совершить в случае распознавания системой определенного образа. Степень 
приспособленности индивидов будем оценивать следующим способом. Обра- 
зуем для всех индивидов по второй хромосоме, каждый ген которой будет 
содержать информацию об оценке состояния системы после совершения ею 
действия, записанного в соответствующем гене хромосомы закона управления. 
Приспособленность индивида определяется как сумма всех таких оценок. 
Индивиды будут скрещиваться соответственно их вероятности скрещивания 
(отношение приспособленности индивида к сумме приспособленностей популя- 
ции). При скрещивании в хромосому потомка отбираются те гены родителей 
(из соответствующих позиций в хромосоме), оценка которых наивысшая. Если 
оба гена не были оценены, то выбирается один из них случайным способом. 
Мутация производится так: после скрещивания каждый ген с очень низкой 
вероятностью мутации принимает значение равномерно распределенной на от- 
резке [0; М] переменной, т. е. меняет свое значение на некоторое произвольное 
из допустимых значений. 

В описанном подходе к реализации БЗ не просто предложить какой-либо 
иной критерий для определения степени обученности БЗ к текущему моменту 
времени, кроме оценивания конечного качества управления, т.е. критерий 
в «системном» духе. Таким критерием может служить, например, относи- 
тельное время пребывания ОУ в состояниях с высокой оценкой. Чем выше 
это время, тем выше качество управления. На рис. 6.23 показана эксперимен- 
тальная гистограмма, столбцы которой соответствуют оценкам состояния ОУ, 
а высоты столбцов отражают долю времени, проведенного ОУ в состоянии 
с этими оценками. Гистограмма (а) снята в начальном периоде жизни ОУ, 
а (6) — по прошествии достаточно большого времени. Можно видеть, что 
в начале своей жизни ОУ находится в каждом из возможных состояний 
сравнимое время, а по прошествии некоторого времени ОУ чаще находится 
уже в состояниях с высокой оценкой. С увеличением времени жизни объекта 
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Рис. 6.23. Пример гистограммы, отражающей качество управления, обеспечивае- 

мого системой с ГА: (а) — в начале жизни ОУ, (6) — спустя некоторое время. Видно, 

что после оптимизации ОУ большую часть времени проводит в состояниях с лучшими 
оценками 


управления доли времени, проводимые им в состояниях с низкой оценкой, 
стремятся к нулю. 

Как указывалось выше, существует и второй вариант использова- 
ния ГА в системе «Пилот». Он состоит в априорной оптимизации БЗ. При 
этом можно провести математическое моделирование работы ОУ при изменя- 
ющихся в разумных пределах свойствах среды и параметров АКА. Найденная 
посредством ГА оптимизированная База Знаний может использоваться далее 
как БЗ для системы ААУ «Пилот», и в дальнейшей работе управляющей 
системы генетические алгоритмы уже не используются. При этом на стадии 
обучения управляющей системы поиск будет происходить уже не на всем про- 
странстве параметров, а только на его подмножестве, отделенном посредством 
ГА. Этим сокращается время обучения и сберегаются ресурсы БЦВМ. 

В нейроноподобной реализации управляющей системы ААУ Базе Знаний 
соответствует трехмерная матрица нейронов. База Знаний, оптимизированная 
посредством ГА, будет представлять собой, следовательно, сильно «прорежен- 
ную» трехмерную матрицу нейронов, для хранения которой потребуется, 
соответственно, меньше памяти, либо аппаратных элементов при микро- 
процессорной реализации нейроноподобной сети. Тем самым, ГА позволяют 
оптимизировать структуру (топологию) нейроноподобной сети управляющей 
системы ААУ. 

Сравним теперь качество работы УС ААУ без использования ГА и с их 
использованием. На рис. 6.24 (а) и (б) представлены результаты, полученные 
при работе управляющей системы без ГА и с ГА, соответственно. При этом 
время жизни ОУ таково, что качество системы с ГА уже достигло своего 
предела. Можно видеть, что качество управления, обеспечиваемое УС, не ис- 
пользующей ГА (т. е. обладающей полными знаниями), несколько превышает 
качество управления, которого может достичь система с ГА. Однако это явля- 
ется платой за, способность системы с ГА обеспечивать лучшую адаптивность 
и экономию ресурсов БЦВМ. 
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Рис. 6.24. Система без ГА (а) обеспечивает несколько более высокое качество 
управления, чем система с ГА (6), что является платой за большую адаптивность 
и экономию вычислительных ресурсов, которые обеспечивают ГА 


В заключение раздела покажем, как выглядит работа системы автоном- 
ного искусственного интеллекта (АИИ), обучающейся управлять данным ей 


Ите: 11.300000 
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Сопіт. тобе: Могтаї Сопіто! 


Рис. 6.25. Начало управления. АЙИ управляющей системы еще ничего не знает 
о свойствах данного ему в качестве объекта управления космического аппарата — 
База Знаний (вверху справа) пуста 
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Рис. 6.26. УС уже накопила некоторые знания, и ей иногда удается удерживать 
АКА в сравнительно стабилизированном состоянии. Но АКА еще часто выпадает 
за допустимые границы, попадая «в руки» внешней системы управления 


автоматическим космическим аппаратом (АКА). Наиболее наглядное пред- 
ставление об этом процессе дает наблюдение за моделирующей программой 
в действии. На страницах книги мы можем показать этот процесс, например, 
с помощью демонстрации последовательных фрагментов, отражающих эволю- 
цию одного процесса управления. 

На рис. 6.25 процесс управления зафиксирован в самой начальной стадии, 
когда управляющая система еще ничего не знает о свойствах АКА — База 
Знаний (вверху справа) еще пуста. Поэтому УС ничего не остается делать, как 
испытывать АКА, дергая его актуатором вверх и вниз с разной силой (левый 
нижний график) и наблюдая за его реакцией. АКА при таком неаккуратном 
с ним обращении сильно трясет (график вверху слева). Но такая тряска 
не очень страшна АКА, так как УС ААУ управляет лишь в очень узком 
диапазоне углов — порядка десятой доли угловой секунды, за пределами ко- 
торого управляет внешняя система управления. При выходе угла отклонения 
АКА или его угловой скорости за пределы диапазона («коридора») внешняя 
система управления возвращает АКА на место — куда-то внутрь коридора. 
Качество управления (график внизу справа) на этой стадии пока плохое. 

Через некоторое время (рис. 6.26) ситуация немного изменяется. УС уже 
поняла некоторые закономерные свойства АКА — в БЗ появились первые 
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Рис. 6.27. ДИИ уже достаточно «умен», чтобы поддерживать АКА в заданном 
положении, но делает это еще недостаточно изящно из-за не слишком 
большого опыта 


знания. Теперь УС может, во-первых, управлять АКА в уже знакомых ей 
ситуациях, и ей удается иногда довольно долго держать АКА более или менее 
ровно (на графике вверху слева видны довольно длинные удачные «пробежки» 
АКА без выходов за пределы заданного коридора углов). В эти периоды 
качество управления (график внизу справа) возрастает. Тем не менее, АКА ча- 
сто еще вываливается из коридора. Это происходит потому, что АКА иногда 
попадает в состояния, для которых у управляющей системы еще нет надежных 
знаний. Возможно, что АКА уже бывал в этих состояниях несколько раз, 
но еще не обнаружил надежной закономерности. 

Во-вторых, первые полученные знания позволяют УС уже целенаправленно 
проводить поиск актуальных для нее знаний. При попадании в еще пустые 
столбцы БЗ, УС уже принимает решения не случайным перебором, но ис- 
пользует принцип аналогии — смотрит, как она поступала ранее в похожих 
ситуациях, и какие это приносило результаты. 

На рис. 6.27 зафиксирована стадия, когда управляющей системе, благодаря 
накопленным знаниям, иногда вполне удается удерживать АКА в заданном 
положении. Выпадения АКА за пределы коридора уже практически отсут- 
ствуют. Качество управления хотя и не идеальное, но высокое. Мы видим, 
что УС еще как-то не очень ловко управляет АКА, почему-то излишне ча- 
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Рис. 6.28. ДИИ демонстрирует мастерское качество управления. Он уже достаточно 
умен и опытен, чтобы одним точным движением возвращать АКА в требуемое 
положение 


сто подталкивая его вверх, это заставляет АКА держаться немного выше 
нулевой отметки по углу, чем несколько и портится качество управления. 
Но, по-видимому, знания, которые УС накопила к настоящему моменту, еще 
не достаточно полны, чтобы управлять лучше. Наш АИИ уже умен, но еще 
не достиг высокого мастерства. 

На рис. 6.28 управляющая система демонстрирует уже высокое качество 
управления. Она способна поставить отклонившийся по какой-либо причине 
АКА на место очень аккуратным и точным движением. 

По заключению специалистов из НПО им. С. А. Лавочкина, управляющая 
система «Пилот» может в 5-7 раз повысить точность стабилизации углового 
положения космического аппарата по сравнению с обычной детерминирован- 
ной системой управления. 

На наш взгляд, поведение управляющей системы ААУ при управлении 
представленным ей заранее не известным объектом управления, в данном 
случае — АКА, демонстрирует вполне естественные свойства, напоминающие 
свойства биологических систем управления. 

То, что поведение АИИ аналогично поведению живого организма, ста- 
новится особенно заметным, если его сравнить с какой-либо хорошо извест- 
ной ситуацией. Например, в рассмотренном примере управления угловым 
движением космического аппарата можно на законных основаниях заменить 
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АКА на обычный велосипед, так как математическая модель углового дви- 
жения твердого тела с набором нелинейных осцилляторов, которая заменяла 
в данном примере АКА, практически идентична модели движения велосипеда. 
При такой интерпретации рассмотренный выше процесс можно интерпрети- 
ровать как обучение системы АИИЙ управлению велосипедом. В этом случае 
нетрудно видеть сходство ее поведения с ситуацией, когда на велосипеде 
учится ездить ребенок. Еще раз посмотрим на рис. 6.25-6.28 с этой точки 
зрения. Здесь верхний левый график (Мефа ѕіаіе) можно интерпретировать 
как траекторию }(#) движения велосипеда по дорожке, границы которой 
обозначены пунктирами сверху и снизу. Будем считать, что при выезде за пре- 
делы дорожки велосипед падает, после чего ребенок снова садится на него 
и пытается ехать дальше. Повороты рулем, которые делает ребенок, отобра- 
жены на графике слева внизу (Асйотз). Навыки ребенка по практическому 
управлению велосипедом (состояние некоторой области его нервной системы, 
скорее всего — периферической) отражены на поле БЗ (Кпошіейде Вазе) 
вверху справа. Текущие ощущения удовольствия /неудовольствия ребенка от- 
ражены на графике эмоциональной оценки текущего состояния (Стайе) внизу 
справа. Итак (рис. 6.25), ребенок, не имея никаких навыков, впервые са- 
дится на велосипед и пытается ехать, отчаянно вертя рулем вправо-влево. 
Естественно, велосипед движется по немыслимой траектории, то и дело 
падая. Ребенок получает неприятные ушибы. Лишь в некоторых случаях 
ему удается немного удержаться на велосипеде. Это вызывает всплески по- 
ложительных эмоций. Спустя некоторое время (рис. 6.26) нервная система 
ребенка уже почувствовала некоторые закономерности, произошло обучение 
соответствующих нейронов, появились некоторые навыки. Ребенку удается 
все дольше удерживаться на велосипеде. В эти моменты он испытывает 
чувство радости. Но время от времени все еще падает, получая неприятные 
впечатления. И вот уже (рис. 6.27) ребенок устойчиво и почти ровно едет 
на велосипеде. Его нервная система накопила достаточно много полезных 
навыков. Но умение еще не совершенно, ребенок довольно активно двигает 
рулем, чтобы удержаться на дорожке. Настроение у него хорошее, иногда — 
отличное. Более того, на этой стадии иногда возникает специфический «ко- 
лебательный» режим, когда ребенок совершает рулем периодические движе- 
ния, обеспечивающие устойчивое движение (рис. 6.29). Наконец (рис. 6.28), 
ребенок освоил управление этим велосипедом вполне хорошо, едет не падая 
и корректирует движение велосипеда уже очень слабыми и точными движе- 
ниями руля. 

Адаптивные свойства проявятся и тогда, когда что-то изменится в велоси- 
педе или когда ребенок (система АИИ) пересядет на другой велосипед (ОУ). 
В этих случаях произойдет либо коррекция навыков (знаний БЗ), например, 
подобно изменениям БЗ, показанным на рис. 6.12, либо произойдет дообучение 
Базы Знаний, если АЙИ распознает, что речь идет о другом объекте управ- 
ления. Последнее можно осуществлять, распознавая объект управления непо- 
средственно по его характерным наблюдаемым фенотипическим признакам, 
либо распознавая объект по косвенным признакам — по поведению объекта 
управления, по его реакциям на управляющие воздействия. 
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АСНОП гиге: 


Рис. 6.29. В некоторых случаях может возникать и такой специфический коле- 
бательный режим управления, который можно наблюдать и в нашей жизни при 
освоении нового объекта управления 


Мы видим картину, практически тождественную естественному процессу 
обучения управлению. При этом обучение управлению произошло непосред- 
ственно в процессе управления. Не выделялось какого-либо специального пери- 
ода для обучения. Если бы для решения задачи управления велосипедом при- 
менялась обычная искусственная нейронная сеть, то требовалось бы заранее 
обучить ее принимать правильные решения на многих обучающих примерах, 
и только после того как обучение будет закончено на всей обучающей выборке, 
и нейросеть подтвердит, что она ошибается лишь не более чем в заданном 
числе случаев, можно было бы ставить нейросеть на велосипед, после чего 
она бы управляла сразу правильно. Аналогичным способом пришлось бы 
использовать и управляющую систему на основе нечеткой логики, но в этом 
случае и правила управления пришлось бы составлять вручную. Все это не де- 
монстрирует адаптивного управления в том смысле, в каком это понимаем мы 
в методе ААУ, где обучение проходит непосредственно в процессе управления. 

Теперь отметим, что аналогичным же образом выглядит адаптивное управ- 
ление очень многими объектами, которые формально относятся к объектам 
одного класса, так как их поведение в признаковом пространстве выглядит 
очень похожим. Тем более что для автономной системы ААУ, находящейся 
внутри ОУ и наблюдающей его только через бинарные сигналы от датчиков, 
в этом смысле абсолютно все равно, что представляет собой ОУ — космический 
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аппарат, велосипед или другой объект. Укажем, например, объекты, которые 
относятся к тому же классу, что и рассмотренное здесь угловое движение 
АКА и движение велосипеда, т. е. объекты, которыми, по-видимому, можно 
управлять с помощью рассмотренного варианта системы ААУ практически 
без изменений. Во всех таких примерах трудно заранее формализовать реак- 
цию ОУ на то или иное воздействие актуатора. Это такие объекты, как: 


— вертикальное движение подвески транспортного средства, где требуется 
адаптация, например, к свойствам транспортного средства, величины 
и характера его груза, состояния рессор и амортизаторов, характеру 
дорожного покрытия; 

— движение резца обрабатывающего станка, валков прокатного стана, где 
требуется адаптация, в частности, к реакциям рабочего инструмента 
и самой обрабатываемой детали; 

— параметры энергоносителя в энергетической системе, связанной с потре- 
бителями, где требуется адаптация, например, к свойствам потребителя; 

— разнообразные технологические процессы, где требуется адаптация ко 
многим специфическим условиям; 

— медицинские диагностические и терапевтические приборы, протезы, где 
требуется адаптация, в частности, к индивидуальным свойствам чело- 
века; 

— множество других объектов, систем и процессов. 


Таким образом, мы показали, что построение адаптивных систем управле- 
ния для динамических технических объектов типа автоматического космиче- 
ского аппарата возможно не только на основе математического моделирования 
их движения и соответствующего аналитического вывода законов управле- 
ния, но и на основе имитационных (бионических) подходов, воспроизводящих 
некоторые принципы работы естественных нервных систем. В частности — 
на основе метода ААУ, который позволяет создать внутри объекта такую 
систему управления, отчасти напоминающую искусственное живое существо — 
систему АИИ, которое, наблюдая за предоставленными ему параметрами 
и управляя предоставленными ему органами управления, автоматически вы- 
явит свойства данного объекта, запомнит их и сможет управлять данным 
объектом, направляя его в те целевые состояния, которые будут указаны извне 
заказчиком такой системы управления через аппарат эмоций. 

Такой подход позволяет избежать предварительной разработки математи- 
ческой модели объекта управления, которая может оказаться чрезвычайно 
трудной, например, в случаях, когда свойства объекта управления плохо 
определены или изменяются в процессе управления. 

Конечно, метод ААУ имеет свои трудности. Одна из таких проблем метода 
связана с определением и ограничением пространств поиска, осуществляе- 
мого системой управления. В каком-то смысле эта проблема, заменяет собой 
проблему разработки математической модели объекта управления. Удобным 
подходом для решения такой проблемы являются генетические алгоритмы, 
которые органичны для метода ААУ, поскольку так же, как и метод ААУ, 
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копируют природные способы управления, в данном случае — процессы поис- 
ковой оптимизации, соответствующие эволюционному развитию организмов. 


Опишем еще несколько прикладных систем на основе метода ААУ. Однако 
сделаем это сравнительно коротко, так как основная идея управления уже 
достаточно подробно описана, как и подробный пример с управлением угло- 
вым движением космического аппарата, представленный в данном разделе. 
Следующие примеры призваны только показать разнообразие объектов, к ко- 
торым можно применить систему ААУ, т. е. превратить эти объекты в системы 
автономного искусственного интеллекта. По сути, для того чтобы оснастить 
объект системой ААУ, необходимо сделать следующее: 


1. Определить необходимый состав датчиков. 

2. Определить необходимый состав актуаторов. 

3. Определить целевые функции управления, конкретизирующие главные 
цели «выживания» и «накопления знаний». 

4. Определить качественные критерии оценки текущего состояния объекта, 

управления. 

Определить критерии оценки качества управления. 

6. Выбрать вид и получить правдоподобную модель объекта управления 
и среды для замены реального ОУ на этапе построения программного 
прототипа системы. 


сл 


6.2. Адаптивное управление 
активной подвеской автомобиля 


При современном уровне развития техники массовым транспортным сред- 
ством для перемещения вдоль земной поверхности все еще являются колес- 
ные тележки — автомобили. Природа давно уже нашла, что перемещения 
на относительно большие дистанции удобнее выполнять с помощью полета 
на машущих крыльях. Они обеспечивают взлет с места, скорость полета, от 
нуля до десятков километров в час над земной поверхностью независимо от 
ее рельефа (следовательно, без нанесения ущерба земной поверхности и без 
траты энергии на силу трения с ее стороны), высокую маневренность, надеж- 
ность и безопасность, посадку с нулевой посадочной скоростью практически 
в любом месте. Для перемещения непосредственно по земной поверхности 
природа изобрела такой способ перемещения, как ходьба на ногах. При ходьбе 
с помощью ног используется имеющий малую силу трения принцип качения, 
но в отличие от колеса используется только два узких сегмента колеса — 
ступни, которые поочередно сменяют друг друга, что не требует подшипников 
качения, а только шарниров. Одновременно ноги как биологическое колесо 
являются и движителем, это обеспечивается тем, что задний фрагмент колеса 
на каждом шаге делается немного выше переднего, что заставляет «колесо» 
перекатываться вперед, а при необходимости задняя нога может и с еще 
большей силой оттолкнуться от поверхности, что обеспечивает изменение силы 
тяги в большом диапазоне. Две ноги заменяют одно колесо, четыре ноги — два 
колеса. Нога представляет собой фрагмент обода колеса — ступню и спицу — 
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сочлененные бедро и голень. При этом длина спицы, т.е. радиус колеса, может 
оперативно изменяться, что обеспечивает возможность преодоления препят- 
ствий до полуметра и более высотой или глубиной. Кроме того, переменная 
длина радиуса колеса — ноги, обеспечиваемая упругим сгибанием коленного 
сустава, вместе со специальным упругим амортизатором стопы поддерживают 
высокую плавность хода корпуса живого организма и практическое отсут- 
ствие вертикальных колебаний головного мозга — наиболее важной части 
организма, хранилища его Базы Знаний, аппарата эмоций и системы при- 
нятия решений. Четырехногие животные (квадрупеды) при ходьбе подобны 
двухколесной тележке, а в неподвижном состоянии стоят на четырех опорах 
и очень устойчивы. Двуногие организмы при ходьбе подобны одноколесному 
велосипеду, а при стоянии опираются на две опоры с расширенной по сравне- 
нию с квадрупедами площадью опоры ступни. Расширенная площадь опоры 
двуногих — стопа хотя и повышает устойчивость при стоянии, но недостаточно, 
поэтому большую роль играет адаптивный механизм балансировки, связан- 
ный с вестибулярным аппаратом. Переход от устойчивого, на четырех ногах, 
к неустойчивому (на двух) способу передвижения закономерен, так как очень 
повышает маневренность организма, что, в свою очередь, влечет развитие 
управляющей системы — нервной системы и мозга. Логика развития привела 
к такому решению, например, и истребительную авиацию, где современные 
истребители делаются запредельно неустойчивыми с повышенной нагрузкой 
на компьютеризированную систему управления. Это обеспечивает высокую 
маневренность. 

Итак, вернемся к такому несовершенному виду передвижения, как ко- 
лесный автомобиль. Очень гордясь своим изобретением — полносегментным 
колесом постоянного диаметра, которое не отрывается от земной поверхности 
и передает на корпус автомобиля толчки от всех неровностей последней, для 
которого и камень, и канава являются непреодолимым препятствием, чело- 
век вложил колоссальные ресурсы в создание миллионов колесных тележек, 
вместо того, чтобы подумать и хотя бы на полметра оторваться от земной 
поверхности, спася тем самым жизнь на земле. Вместо этого, как всегда эгои- 
стически, нимало не заботясь о природе, человек пошел по самому примитив- 
ному пути — сглаживания земной поверхности в угоду своему примитивному 
колесу, устраивая так называемые дороги с твердым покрытием. Успешно 
закатав под асфальт ощутимую долю поверхности земного шара, чудовищно 
огромные территории ценнейшей плодородной почвы нашей маленькой пла- 
неты, человек никак не может победить вертикальных колебаний колесной 
оси, передаваемых на раму автомобиля, с установленными на ней сидениями, 
на которых он хотел бы, не совершая неприятных колебаний в вертикальной 
плоскости, в комфортных условиях созерцать остатки плодородных почв около 
асфальтовых шоссе. 

Традиционные способы борьбы с вертикальными колебаниями автомобиля 
состоят в следующем. Выравнивание земной поверхности до зеркального со- 
стояния, чтобы колесо катилось по ней, не испытывая ни малейших верти- 
кальных смещений. Это основной подход, и в нем уже преуспели до того, что 
постепенно становятся ненужными все другие средства: достаточно посмот- 
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реть на исчезающе малую толщину шин модных автомобилей. Идя по этому 
пути, в пределе получаем очень удобный земной шар в виде гладкого шарика, 
похожего на стальной шарик от шарикоподшипника. 

Установка на подвеску автомобиля амортизационной системы, состоящей 
из упругого (пружина) и демпфируюшего (амортизатор) элементов, а также 
установка камеры и шины на твердый обод колеса. Установка аналогичных 
средств амортизации между рамой автомобиля и кабиной для людей, между 
кабиной и сидениями для людей, между сидениями и собственно людьми. 
Далее уже в теле человека между местом, на котором принято сидеть, и моз- 
гом работает еще целый ряд амортизирующих систем. Управление верти- 
кальными перемещениями корпуса автомобиля. Это последнее достижение 
научно-технической мысли человечества. Остановимся на нем, пока людям 
не пришла в голову спасительная мысль: выкинуть колесо на свалку истории 
и тем спасти себя от вертикальных колебаний оси колеса, а планету — от 
умерщвления под асфальтом. 

Необходимость управления вертикальными колебаниями через управление 
подвеской диктуется требованиями комфорта, а также безопасности авто- 
мобиля. Эти требования иногда противоречивы — комфорт требует мягкой 
подвески, но мягкая подвеска ухудшает устойчивость и управляемость автомо- 
биля. Неуправляемые подвески создаются в расчете на средние и предельные 
условия, в которых будет эксплуатироваться автомобиль — средний и пре- 
дельный вес, качество дорог, режимы эксплуатации и т. д. Первые решения, 
связанные с желанием управлять подвеской, были связаны с простой идеей — 
иметь два или несколько режимов работы подвески и переключать их вручную 
по мере необходимости (подключать дополнительные амортизаторы и т. п.). 
Увлекательный процесс управления подвеской отвлекает водителя и может 
служить причиной инцидентов на дорогах. Предлагаются решения на уровне 
фокусов механики и гидравлики, обеспечивающей нелинейные характеристики 
в зависимости от условий работы подвески (например, чем больше нагружаешь 
автомобиль, тем жестче становится подвеска). Наконец, появились подвески 
с устройствами, допускающими регулирование, а иногда и быстрое регулиро- 
вание некоторых параметров. Такие подвески принято называть активными. 
Примерами являются амортизаторы, способные создавать импульсы силы, 
использующие внешнюю систему высокого давления, а также амортизаторы 
переменной вязкости, использующие магнитореологическую жидкость МВЕ, 
управляемую электромагнитным полем. Встал вопрос о том, как управлять 
этими возможностями автоматически, по какой программе бортовой компью- 
тер должен принимать решения. Традиционные решения, основанные на том, 
что сначала создается математическая модель движения автомобильной под- 
вески, а потом по ней рассчитывается закон управления, оказались слож- 
ными. Математическая модель подрессоренного автомобиля становится, как 
обычно, чрезвычайно сложной при попытке учесть очевидные реалии объекта. 
Ситуация усложняется и тем, что параметры подвески и ее модели сильно 
меняются при изменении свойств автомобиля и дороги. Заранее учесть все 
эти изменения трудно. Отсюда возникает желание использовать адаптивные 
методы управления. В частности — метод ААУ. 
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Рис. 6.30. Схема включения актуатора в состав подвески автомобиля. Здесь М — 

подрессоренная масса, т — неподрессоренная масса подвески, (+) — профиль 

дороги, 2(#) — вертикальное движение оси колеса, у(Р) — вертикальное движение 
корпуса автомобиля, Т(#) — импульсы силы, создаваемые актуатором 


Если есть актуаторы, которыми можно управлять, если есть датчики, по 
которым можно отслеживать текущее состояние ОУ и результаты управле- 
ния, если есть цели, к которым нужно стремиться при управлении, и кри- 
терии для оценивания качества управления, то метод ААУ можно приме- 
нить. Фактически, требуется создать систему автономного искусственного 
интеллекта (АИИ), которая будет приспосабливаться к текущим свойствам 
автомобиля и его подвески — дополнительный искусственный водитель, спе- 
циализирующийся на управлении подвеской, постепенно набирающийся опыта, 
и приспосабливающийся к свойствам вверенного ему автомобиля. 

Оснастим подвеску каждого колеса, транспортного средства активным эле- 
ментом — актуатором, позволяющим воздействовать на вертикальное переме- 
шение у($) корпуса (рис. 6.30). Текущую вертикальную координату корпуса 
автомобиля можно оценивать с помощью акселерометра. 

Сложнее обстоит дело с указанием целевого положения корпуса авто- 
мобиля, которое надо ввести в целевые функции системы ААУ. Если бы 
автомобиль летел над землей, то желаемой траекторией у(#) была бы пря- 
мая горизонтальная линия. Но колеса автомобиля не отрываются от земли, 
а корпус автомобиля не отрывается от колес дальше, чем ему позволяет 
подвеска. Поэтому желаемая траектория движения корпуса лежит в опреде- 
ленном «коридоре» высот над поверхностью дорожного полотна. Желаемую 
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траекторию движения корпуса можно вычислить с учетом норм физиологи- 
ческих и эргономических требований к допустимым колебаниям пассажира 
автомобиля в вертикальной плоскости. Для этого можно использовать методы 
цифровой фильтрации. Таким образом, бортовая система АЙИ всегда имеет 
представление о желаемом положении корпуса автомобиля и «видит», где он 
на самом деле находится в текущий момент. 

Средством для приведения корпуса автомобиля из текущего положения 
в желаемое является актуатор. Если бы желаемая траектория была пред- 
ставлена жестким рельсом, а актуатор — крепким крючком, которым можно 
было бы зацепиться за рельс, то проблем бы не было. Но актуатор может 
только подтолкнуть автомобиль вверх или вниз, вызвав такой же эффект, как 
наезд на небольшой камень или ямку на дороге. Как же выбрать величину 
такого управляющего толчка, чтобы он точно погасил отклонение корпуса 
автомобиля от желаемого положения? От расчетов по модели мы сознательно 
отказались. Здесь на помощь и приходит База Знаний системы ААУ. Обучив- 
шись, она точно знает, как отреагирует данный автомобиль на тот или иной 
толчок актуатора. Управляющей системе остается только выбрать наиболее 
подходящий из всех возможных толчков. В результате управляющая система 
как бы аккуратно подталкивает корпус автомобиля в нужном направлении, 
и при этом корпус автомобиля движется близко к желаемой траектории, 
а пассажиры чувствуют себя комфортно, поскольку желаемая траектория 
выбрана, с учетом их физиологических требований. 
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Рис. 6.31. Примеры движения корпуса автомобиля: а) профиль дороги; б) движение 
корпуса обычного автомобиля без системы АЯСА$Ѕ; в) вычисленная желаемая тра- 
ектория движения корпуса; г) движение корпуса автомобиля, снабженного системой 


АасАѕ 
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На рис. 6.31 представлен фрагмент процесса управления, демонстрируемый 
разработанной нами системой, названной системой АаСА$ (айарбіхе сопіто] ої 
асйуе ѕиѕрепѕіоп) [45, 46]. 

На рисунке (а) показан смоделированный профиль довольно неровной до- 
роги. График (6) отражает движение автомобиля с обычной подвеской. Видно, 
что корпус автомобиля сильно раскачивается в вертикальной плоскости. Гра- 
фик (в) отображает желаемую траекторию движения корпуса автомобиля 
в данных условиях, с учетом физиологических требований человека. Наконец, 
график (г) показывает, как движется корпус автомобиля при управлении 
системой ААСАЅ. Можно видеть, что движение корпуса теперь гораздо более 
плавное, чем у автомобиля с обычной подвеской. Таким образом, бортовая 
система АИИ приспособилась к свойствам данного автомобиля и научилась 
управлять его подвеской, поддерживая корпус автомобиля в состоянии, соот- 
ветствующем требованиям заказчика, системы. 

Очевидно, что желаемую траекторию движения корпуса автомобиля 
можно вычислять с учетом различных требований, а не только требований 
комфортности. Можно учитывать и требования устойчивости, и требования 
управляемости и другие. Например, во время поворота можно требовать, 
чтобы корпус автомобиля не наклонялся набок, при торможении — не клевал 
носом и т.п., и система ААУ будет выполнять эти команды, т.е. аппарат эмоций 
системы ААУ должен, подобно капитану корабля, указывать цель управления, 
а система принятия решений с помощью накопленных в БЗ знаний свойств 
данного автомобиля, подобно боцману корабля, знает, как добиться указанной 
цели с помощью актуаторов — экипажа. Более подробно вся система АаСАЗ 
описана в работе [45]. 


6.3. Мобильный робот Гном № 8 с нейроноподобной 
адаптивной системой управления 


Удовлетворенные работой рассмотренных выше систем автономного искус- 
ственного интеллекта, работавших в роли пилотов динамических объектов, мы 
решили еще ближе подойти к созданию модели живого существа, и сочли, что 
наиболее адекватной моделью такого рода будет являться мобильный робот, 
напоминающий живое существо и внешним видом, и поведением. В настоящем 
разделе мы представим результаты только очень коротко (см. также [91, 92]). 

Кевин Уорвик в книге [31] представил своих малогабаритных мобиль- 
ных роботов «Семь гномов». По аналогии мы решили назвать своего робота, 
«Гном №8». Идея мобильного робота Гном № 8 состояла в том, чтобы выпол- 
нить следующие пункты. 


1. Робот должен представлять собой аналог новорожденного живого суще- 
ства, конструктивно приспособленного к особенностям предполагаемой среды 
обитания, но не умеющего вести себя в этой среде. 


2. Управляющая система робота должна быть построена по методу ААУ, 
при этом в нейроноподобной его реализации, так чтобы в случае успеха 
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можно было говорить о том, что робот управляется нейроноподобной нервной 
системой. Под «нейроноподобной» системой управления мы понимаем такую 
программу для персонального компьютера, которая реализует работу описан- 
ных в этой книге нейросетевых конструкций, таких, что, будь у нас в руках 
конструктор из нейронов, мы могли бы собрать из него эти конструкции. 
Полагалось, что количество программных вставок, не соответствующих ней- 
росетевой метафоре, в этой системе управления будет минимальным, и они 
будут заменять собой только второстепенные подсистемы. 


3. Предполагалось, что робот Гном №8 будет существовать в виде про- 
граммной модели, но эта модель должна быть технически правдоподобной, 
т.е. такой, чтобы при желании ее легко можно было бы реализовать «в 
железе». Мы сразу отказались от условных моделей среды типа клеточного 
пространства и условных моделей робота в виде клеточного автомата, потому 
что, во-первых, такие модели сильно абстрагируют реальность, а мы предпо- 
лагали в дальнейшем осуществить перенос системы управления на реальные 
физические роботы. 


4. Сходство с новорожденным существом у робота должно было состоять 
в том, что при запуске он не должен был иметь навыков поведения в предъяв- 
ленной ему среде и должен был бы сам формировать свое поведение. Предпо- 
лагалось, что робот будет моделировать следующую сцену, которую каждый 
человек может наблюдать на детской площадке или в семье, где есть маленькие 
дети. Когда ребенка впервые усаживают за руль трехколесного велосипеда 
или электрической детской машины, и машина начинает движение, то обычно 
руль, педали, голова ребенка и сама машина движутся совершенно независимо 
друг от друга. Ребенок смотрит вправо, велосипед едет налево, столкновение 
с препятствиями неизбежно и совершенно неожиданно для ребенка. Если 
столкновение сильное, то дело может дойти до испуга, падения и плача. 
В этом состоянии ребенок совершенно не понимает многого: что направле- 
ние движения зависит от положения руля, а скорость зависит от скорости 
вращения педалей, что препятствие, которое он видит, может стать причиной 
столкновения и удара, что удар — дело неприятное и иногда, болезненное, он 
не знает, что столкновения можно избежать, если правильно и вовремя ис- 
пользовать руль и т. д. Однако проходит некоторое время, и ребенок начинает 
понимать, что с помощью руля он влияет на траекторию движения велоси- 
педа, а с помощью педалей — на скорость движения. Он начинает понимать, 
что столкновение с препятствиями сулит неприятности и что лучше этого 
избегать. Он начинает понимать, что способ избежания столкновений связан 
с манипулированием рулем, и то, что он видит на расстоянии от машины, 
вскоре окажется перед ним. Наконец, он находит такие способы поворота 
руля, которые обеспечивают ему своевременный объезд препятствий. Если 
сформулировать это на техническом языке, то можно сказать, что в нервной 
системе ребенка происходит выработка стереотипов поведения при обходе 
препятствий. Именно этот процесс мы и предполагали смоделировать в модели 
робота и его системе управления. 
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Рис. 6.32. Геометрические характеристики компьютерной модели мобильного ро- 
бота Гном № 8, который мог передвигаться по фиксированным траекториям (а), имел 
«визуальные» и «тактильные» датчики (6) 


Робот представлял собой круглую в плане тележку (рис. 6.32) с реверсив- 
ным приводом и рулевым управлением, обеспечивающими движение по задан- 
ным траекториям (а). Робот был снабжен тремя «визуальными» датчиками, 
регистрирующими наличие препятствий в трех секторах обзора Гу, Гэ и Ёз 
и четырьмя тактильными датчиками Ту, 75, Тз и Тл, расположенными по 
периметру корпуса (6). 

Целевая функция робота состояла в выработке стереотипов поведения при 
обходе препятствий в реальном времени управления. Управляющая система 
робота была построена на Базе описанных выше нейронов. 

Перед «рождением» роботу задавалось следующее: 


а) из эмоциональных оценок априорно было задано только то, что прикос- 
новение тактильными датчиками к препятствию неприятно — вызывает 
отрицательную эмоциональную оценку, а отсутствие сигналов со всех 
датчиков вызывает максимально приятную эмоциональную оценку; 

б) из репертуарного поведения было задано одно — при отсутствии види- 
мых препятствий двигаться прямо вперед, этим заменялись цели более 
высоких уровней. 


Мы будем описывать поведение робота, пользуясь адекватной терминоло- 
гией. В начале своей жизни робот никак не реагировал на видимые препят- 
ствия и часто наезжал на них. Догадавшись, что неприятности происходят 
от столкновений с препятствиями, робот понял, что их надо избегать. Он 
понял, что столкновения следуют закономерно, если препятствие наблюдал 
ется определенным образом и после этого совершается определенное действие 
(например, столкновение происходит, если препятствие видно левым «глазом» 
и после этого совершается перемещение вперед-налево). Он понял также, что 
при наблюдении препятствия и совершении определенных действий столк- 
новения можно избежать (например, столкновения можно избежать, если 
препятствие видно левым «глазом» и после этого совершается перемещение 
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Рис. 6.33. Треки движения автономного самообучаемого мобильного робота 
Гном № 8 на пространстве с препятствиями. В начале своей жизни робот не знает, как 
обходиться с препятствиями, и натыкается на них (а). Постепенно робот начинает 
понимать, как следует обходиться с препятствиями, и находит способы их объезда (б) 


вперед-направо или назад или назад-направо) и т. д. Эмпирически найденные 
знания постепенно накапливались в Базе Знаний робота. 

По мере накопления знаний в БЗ поведение робота становилось все более 
разумным. Это проявлялось в том, что постепенно робот перестал сталки- 
ваться с препятствиями и научился успешно их объезжать. Робот с очевид- 
ностью демонстрировал автоматическую выработку способов безаварийного 
движения — движения без столкновений с препятствиями. На рис. 6.33 по- 
казаны два фрагмента из жизни робота. На фрагменте (а) робот находится 
в начале жизни, он часто сталкивается с препятствиями, так как не умеет 
сопоставлять принятие решений с видимой им ситуацией и эмоциональными 
оценками. Фрагмент (6) показывает, как движется робот в более поздней 
стадии своей жизни — столкновения с препятствиями уже крайне редки. 

Количественно постепенное повышение качества управления можно про- 
демонстрировать с помощью графика (рис. 6.34), показывающего уменьшение 
среднего числа соударений робота с препятствиями в зависимости от запол- 
ненности его Базы Знаний, которая соответственно растет со временем жизни 
робота. 

По графику на рис. 6.34 можно видеть, как вначале высокая частота, 
столкновений робота с препятствиями сначала медленно уменьшается по мере 
приобретения роботом некоторых навыков управления, но потом резко падает, 
когда БЗ заполнена примерно на 28%. Видимо, здесь робот нашел некоторые 
очень полезные знания, которые решительно изменили его поведение, и ча- 
стота столкновений существенно уменьшилась. Затем был некоторый всплеск 
(при 45%), возможно, из-за получения какого-то ненадежного или ложного 
навыка. Но после заполнения БЗ на 50% частота столкновений упала до нуля 
и последующие знания, можно сказать, были уже излишними с точки зрения 
выбранного критерия. 

Данная модель оказалась очень удобной для постановки различных экспе- 
риментов с системой ААУ. Для этой модели участниками нашей исследова- 
тельской группы было разработано множество различных программ и опро- 
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Рис. 6.34. Постепенное уменьшение частоты столкновений робота с препятствиями 

по мере накопления знаний в БЗ робота. Обучение происходит непосредственно 

в процессе управления. Процесс аналогичен тому, как ребенок учится объезжать 
препятствия 


бованы различные полезные алгоритмы. На этой модели наблюдалось много 
интересных эффектов. Например, известный эффект водителя с двухлетним 
стажем: научившись объезжать препятствия, робот через некоторое время 
начинал переставать бояться препятствий, постепенно терял бдительность, 
пока не попадал в аварию (сталкивался с препятствием). Тогда он опять 
пугался и начинал ездить осторожно. Наблюдался и эффект пугливого робота, 
когда робот понимал, что от всех препятствий лучше уходить задним ходом, 
не связываясь с ними. И эффект перемены ценностей, когда при изменении 
«потребительской стоимости» препятствия — замены отрицательной эмоции 
от столкновения с ним на положительную эмоцию робот начинал специально 
наезжать на препятствия в надежде на получение удовольствия. 

В дальнейшем этот робот и его нервная система подвергались оптимизации 
генетическими алгоритмами, демонстрируя интересные эффекты приспособ- 
ления [105]. 

Совместно с биологами из грушы К. В. Анохина (Институт нормальной 
физиологии РАМН) проводятся интересные сравнительные эксперименты ро- 
бота с реальными живыми объектами — новорожденными мышатами [118]. 

Конструировалась многоуровневая адаптивная система управления для 
этого робота [119], где робот сам учился ставить себе цели, формировать 
некоторые простые стратегии их достижения и двигаться к ним, объезжая 
препятствия. 

Хочется здесь подчеркнуть, что ценность такой системы управления ро- 
ботом двояка. Основное достижение состоит в том, что робот демонстрирует 
процесс автоматического самообучения навыкам вождения, выбора маршрута, 
и постановки цели. Начиная с простого наивного состояния полного непони- 
мания обстановки, робот постепенно и самостоятельно научается управлять 
своим движением в среде с препятствиями. Это во многих отношениях напо- 
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Рис. 6.35. Сравнение качества управления мобильным роботом, обеспечиваемое 

системой ААУ и детерминированной системой управления. Система ААУ постепенно 

догоняет детерминированную систему управления по качеству управления и обго- 
няет ее (рисунок из дипломной работы А. М. Кондукова) 


минает процесс обучения живого организма. Еще раз скажем, что нам пока 
неизвестны аналоги такого поведения роботов. Обычно управляющая система 
мобильного робота оснащается системой нечеткой логики, где заранее запи- 
сываются и отлаживаются правила его поведения: например, как правильно 
объезжать препятствия. Если используется нейросеть, то она тоже обучается 
предварительно, до того как робот выпускается на полигон. 

Второе наше достижение состоит в том, что качество управления роботом, 
демонстрируемое системой управления ААУ, после некоторого периода само- 
обучения начинает превосходить качество управления, которое достигается 
детерминированной системой управления. Детерминированная система управ- 
ления создавалась нами с учетом всех особенностей данного робота и среды, 
это позволяло говорить, что правила принятия решений в такой системе управ- 
ления были близки к оптимальным. Однако система ААУ постепенно догоняла 
детерминированную систему управления по качеству управления и обгоняла 
ее (рис. 6.35). Здесь проявляется способность системы ААУ эмпирически нахо- 
дить более эффективные правила управления, чем те, которые можно рассчи- 
тать по априорной информации. Конечно, можно поднять качество управления 
детерминированной системы за счет более точного расчета всех закономер- 
ностей, которые можно предусмотреть по априорной информации. Но это 
будет требовать все более сложных расчетов и применения оптимизационных 
методов. Со своей стороны, можно легко повышать и эффективность работы 
управляющей системы ААУ, возможности которой не только не исчерпаны, а, 
напротив, находятся в самой начальной стадии осознания. Однако мы хотим 
подчеркнуть, что тем самым показано, что системы ААУ, помимо теорети- 
ческого значения, имеют вполне прагматический смысл — они дают более 
высокое качество управления, чем детерминированные системы. Это ценно 
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для тех заказчиков систем управления, которым не важен принцип построения 
систем управления, а важен только конечный результат. 

Таким образом, поставленная ранее цель — создать нейроноподобную са- 
мообучаемую систему управления для мобильного робота, способную к выра- 
ботке простых стереотипов поведения, была достигнута. 


6.4. Прототип адаптивной системы 
поддержки принятия решений 
при управлении социальными объектами 


Коротко опишем прототип системы поддержки принятия решений при управ- 
лении социальными объектами, разработанный на основе системы ААУ и на- 
званный нами «Тактик» [37]. В органах социального управления каждое лицо, 
принимающее решения (ЛПР), или соответствующий орган по своей сути 
является системой АДУ. В этом случае, как и в других рассматриваемых 
случаях, система состоит из управляющей системы (УС), исполнительных 
органов (ИО), среды и блока датчиков (БД). Здесь УС — это ЛПР, БД — это 
люди и технические средства, подготавливающие данные к виду, который вос- 
принимается ЛПР; ИО — это средства, обеспечивающие реализацию команд, 
поступающих от ЛПР, например, органы исполнительной власти; среда — 
это та социальная структура, которой управляет ЛПР. Четких границ между 
функциями, которые можно относить к ИО, БД и среде, определить невоз- 
можно, а в соответствии с методологией ААУ в этом и нет необходимости. Бу- 
дем полагать, что УС управляет всей системой, которая объединяет в себе ИО, 
БД и среду, входы которой суть входы ИО, а выходами являются выходы БД. 

Будем рассматривать сравнительно простой случай, ориентируясь на сле- 
дующие нестрогие условия: 


— свойства среды плохо известны, но стационарны в некотором смысле; 
— акты управления эквидистантны во времени; 

— ЛПР способно контролировать не слишком большое число параметров; 
— набор возможных решений ЛПР конечен и может быть перенумерован. 


Среда УС ААУ 


ИО 


Рис. 6.36. Схема использования системы ААУ в качестве системы поддержки 
принятия решений при управлении социальным объектом 
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Рис. 6.37. Образец использования системы ААУ для поддержки принятия решений 
при управлении социальным объектом. Обучение на архивной выборке реальных 
данных. Ряд 1 — воздействия, рекомендованные системой «Тактик», Ряд 2 — управ- 
ляемый процесс (архивные данные), Ряд 3 — управляющие воздействия (архивные 
данные). По оси абсцисс отложено время (недели). По оси ординат — величина, 
рейтинговой оценки (чем больше значение — тем хуже ситуация) и величина управ- 
ляющего воздействия (чем больше значение — тем больше затраты на реализацию 
действия) 


Блок датчиков пусть представляет собой систему подготовки данных для 
ЛПР в виде, например, временного ряда числовых данных х(®) (рис. 6.36). 
Пусть каждое число х(Р) есть агрегированная интегральная рейтинговая 
оценка, полученная с помощью экспертов и характеризующая состояние тех 
параметров ОУ, которые интересуют ЛПР. На множестве значений х() ЛПР 
может определить целевую функцию своего управления. Например, пусть 
ЛПР стремится к уменьшению значений 2(#) (верхняя кривая на рис. 6.37). 
Временной ряд у(#) (нижняя кривая на рис. 6.37) — это решения (воздей- 
ствия), посредством которых управляет ЛПР. Номера решений упорядочены 
по стоимости, которая требуется для их практической реализации, а близкие 
по номеру решения соответствуют содержательно близким воздействиям. 

Включим УС ААУ в систему параллельно с ЛПР (рис. 6.36). В процессе 
работы системы УС ведет наблюдение за данными, поступающими с БД, и за 
решениями, принятыми ЛПР. 

В УС на этапе обучения следует отключить аппарат принятия решений 
УС ААУ, и подавать в УС информацию о решениях, принятых ЛПР. В осталь- 
ном обучение осуществляется так, будто решения принимаются самой УС. 
О степени обученности УС можно судить по наполнению БЗ либо по специ- 
альным тестам. Когда объем знаний в БЗ достигнет необходимого уровня, 
можно разрешить УС принимать управляющие решения. В этом режиме УС 
наблюдает информацию 2(#), предоставляемую БД, сопоставляет ее с эмпири- 
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ческими знаниями своей БЗ и принимает решение 2(7 + 1). Однако решение, 
принятое УС, не передается непосредственно ИО, а поступает к ЛПР, которое 
принимает окончательное решение у(# + 1). Информация о решении у(# + 1) 
поступает к УС для дальнейшего ее обучения. ЛПР может направить УС 
запрос 4 на выдачу объяснений принятому решению. 

При разработке прототипа системы «Тактик» необходимо было распо- 
лагать математической моделью объекта, управления (объединяющей в себе 
модели ИО, среды и БД) для отладки системы, быстрого ее обучения, те- 
стирования и исследования свойств. Требования к соответствию такой модели 
свойствам реального ОУ могут быть самыми простыми — наличие нелинейных 
функциональных зависимостей выходной информации от входных воздей- 
ствий при возможной помехе. Это соответствует условию высокой неопре- 
деленности исходных знаний о свойствах ОУ и расчетам на оговоренную 
выше универсальность УС. При работе на такого рода модели УС наблюдала 
за имитацией «интегральной рейтинговой оценки» и управляла процессом 
при помощи управляющих воздействий. Цель управления состояла в том, 
чтобы приблизить рейтинговую оценку к нулевому уровню значений. По мере 
накопления знаний в БЗ качество управления повышалось. Здесь система 
«Тактик» работала в полностью автоматическом режиме. 

Очевидно, что одна из проблем использования метода ААУ в этом при- 
ложении состоит в большом времени, необходимом для накопления знаний, 
достаточных для качественного управления, поскольку характерное время 
цикла управления имеет порядок суток или даже недель. В таких условиях 
необходимо использовать предварительное обучение БЗ. Предусматривались 
две возможности предварительного обучения. Первая из них состоит в обу- 
чении по адекватной математической модели данной социальной системы как 
объекта управления. При этом задача построения такой модели выделяется 
в отдельную проблему, которую здесь мы рассматривать не будем. Вторая 
возможность предварительного обучения состоит в использовании архивной 
информации, описывающей реальный процесс управления данным ОУ, если 
таковая имеется. 

Проверка возможностей обучения УС ААУ по архивным выборкам дан- 
ных показала применимость такого подхода. На рис. 6.37 представлены пред- 
варительные результаты работы системы «Тактик» на обучающей выборке 
реальных данных. Верхний график есть управляемый процесс 2(1), качество 
состояния оценивается тем выше, чем значения величин меньше. Нижний 
график отражает управляющие воздействия у(#). Система «Тактик» несколько 
раз просматривала эти данные объемом 90 точек, после чего эта же вы- 
борка предъявлялась в качестве реальной ситуации. Анализируя процесс, УС 
выдавала рекомендации по управляющим воздействиям, показанные квадра- 
тиками. Однако очевидно, что УС не могла влиять на архивный процесс, 
а о качестве управления можно судить, сравнивая решения, принятые УС, 
с зафиксированными в архиве решениями, реально принятыми ЛПР. Можно 
видеть, что в данном примере в 37% случаев решения, принятые системой 
«Тактик», совпадают с реальными решениями ЛПР, в 15% случаев решения 
близки, а в 19% случаев система «Тактик» приняла решения, представляющи- 
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Рис. 6.38. Образец использования традиционной нейросети для поддержки при- 

нятия решений. Ряд 1 — результаты прогнозирования нейросетевой программы. 

Ряд 2 — управляемый процесс (архивные данные). Ряд З — управляющие воздей- 
ствия (архивные данные) 


еся более правильными. Например, в начале выборки, когда управляемый про- 
цесс ухудшался, УС рекомендовала более активные действия, чем те, которые 
принимало ЛПР и которые не смогли быстро остановить ухудшение процесса. 
Или в нескольких случаях, когда управляемый процесс улучшался, УС прини- 
мала решения не совершать управляющих воздействий, что могло бы привести 
к экономии средств на реализацию управляющих воздействий по сравнению 
с реальными затратами, имевшими место. 

Таким образом, предварительное обучение УС представляется возможным 
и целесообразным и может быть осуществлено несколькими способами. При 
этом предварительные знания могут пополняться и уточняться при последу- 
ющем управлении в реальном времени. 

Необходимо также пояснить отличия метода ААУ от стандартных нейросе- 
тевых подходов, в которых нейросети используются для решения задачи обу- 
чения распознаванию. В этом качестве они могут использоваться для управ- 
ления, если заранее известно, какие действия следует предпринимать при 
распознавании того или иного образа. На рис. 6.38 на примере той же выборки 
данных показано, как применяется обычная нейросетевая программа. После 
многократного просмотра выборки, нейросетевая программа просматривает 
выборку в режиме предсказания, и в случае, когда она распознает ситуацию, 
результат можно интерпретировать как прогноз управляемого процесса (пока- 
зано квадратиками на рис. 6.38). Таким образом, обычная нейросеть прогнози- 
рует, каким будет значение управляемого процесса в текущих условиях и при 
совершенном управляющем воздействии. Напротив, УС в методе ААУ в этой 
же ситуации идет дальше и сразу указывает лучший вариант управляющего 
воздействия (рис. 6.37). 
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Как можно видеть, в этом приложении УС ААУ работает не в обычном для 
нее автоматическом режиме, а в режиме полуавтоматическом, выполняя роль 
экспертной системы. При этом, в отличие от экспертной системы, УС ААУ 
работает на своего рода «рефлекторном уровне», набирая статистику по преце- 
дентам пространственно-временных вариаций наблюдаемой информации и их 
связям с выходными воздействиями, не вдаваясь в содержательный смысл 
найденных закономерностей. 


6.5. Использование метода ААУ для управления 
финансовыми операциями 


Рассмотренный выше прототип системы поддержки принятия решений «Так- 
тик» может быть использован и для поддержки принятия решений в эконо- 
мической сфере. Пусть ОУ есть некоторая рыночная система. ЛПР отсле- 
живает интересующий его параметр и пытается обнаружить закономерности 
его временного хода. В зависимости от результатов своего прогнозирования 
развития ситуации ЛПР принимает очередное решение, например о купле 
или продаже ценных бумаг. От предыдущего случая данная система может 
отличаться тем, что воздействия ЛПР не в состоянии повлиять на ОУ в силу 
относительной слабости такого воздействия. В этом случае воздействие ЛПР 
влияет только на его собственную прибыль и зависит от того, угадал ЛИР 
тенденцию поведения ОУ или не угадал. Тем не менее, метод ААУ может 
использоваться и в таком приложении, при этом основная нагрузка ложится 
на подсистему формирования и распознавания образов (ФРО) и ее способности 
отыскивать закономерности, в том числе в процессе их агрегирования, а также 
на свойства ААУ адаптироваться к изменениям свойств ОУ, что характерно 
для таких объектов, как финансовые системы. 
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Читатель, ознакомившийся с методом автономного адаптивного управления, 
обычно спрашивает, чем он отличается от других интеллектуальных методов. 
Ведь нейросети, например, тоже хорошо распознают образы, а с помощью 
экспертных систем можно управлять, и есть некая версия экспертных систем, 
которая тоже самообучается. По сути — вся эта книга является ответом 
на такие вопросы. Тем не менее, попробуем все же коротко сформулировать 
ответ. 

Вначале определим, что и с чем будем сравнивать. Мы будем сравнивать 
систему ААУ со следующими системами искусственного интеллекта: 

— системы распознавания образов; 

— нейронные сети; 

— экспертные системы; 

— нечеткие системы; 

— системы обучения с подкреплением. 

Сравнение систем можно проводить по разным критериям. Мы будем 
сравнивать системы: 

— по исходной идее и цели их создания — по назначению систем; 

— по принципу действия системы в ее «каноническом» виде, с указанием 

тенденций развития таких систем; 
— по содержанию используемых в системе знаний, степени автоматизации 
и способам реализации. 
Далее мы укажем также возможности объединения сравниваемых методов. 


7.1. Системы распознавания образов и системы ААУ 


Системы распознавания образов (СР) относятся к наиболее ярким результа- 
там в области построения автоматических систем, способных решать слож- 
ные интеллектуальные задачи. Эта область получила строгое математическое 
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обоснование, позволившее получать надежные решения, благодаря чему эти 
системы распознавания применяются в самых ответственных технических 
объектах и системах. Большой вклад в развитие математических оснований 
систем распознавания внес академик Ю. И. Журавлев [34] и ряд ученых его 
школы. Именно благодаря важной практической необходимости автомати- 
зации задач распознавания на развитие теории СР было направлено много 
усилий. Бионические аспекты задачи распознавания образов не просто по- 
неволе отодвигались на второй план, можно говорить о том, что биони- 
ческий подход во многом противоречил задаче построения СР. Человеку, 
как и любому живому организму, присуща способность иногда ошибаться 
при распознавании и совершать пробные действия при обучении. В важных 
практических системах, требовавших решения задач распознавания, ошибки 
и случайные компоненты должны были быть сведены к минимуму, т.е. био- 
нические подходы были в принципе неприемлемыми, несмотря на то, что речь 
шла о разработке интеллектуальных систем. Другими словами, требовалось 
разработать такие системы распознавания, которые справлялись бы с этой 
задачей лучше, чем ее мог решать человек, работали бы надежнее, точнее 
и быстрее человека. 

Если все же сравнивать СР и системы ААУ, хотя такое сравнение некор- 
ректно, то можно сказать следующее. Принцип действия СР зависит от их 
типа и связан с применением всего доступного запаса методик, наработанных 
в высшей математике, с применением формальных математических методов, 
например, статистической теории принятия решений, теории вероятностей, ло- 
гики, математической лингвистики, комбинаторики. Существуют самообучае- 
мые СР. Но по своему назначению СР решают именно задачу распознавания, 
а не управления. Их использование в системах управления связано с тем, что 
обычно в технических системах вопрос принятия решения сводится к задаче 
распознавания: если распознана такая-то ситуация, то принимаем такое-то 
решение, если распознана иная ситуация, то принимаем иное решение. 

Система ААУ разрабатывалась как концептуальная модель нервной си- 
стемы. Разработчики ставили перед собой задачу из разряда фундамен- 
тальных проблем — исследование и моделирование нервной системы. Мы 
не были ограничены рамками каких-либо ТЗ или прагматических требо- 
ваний по точности, надежности и т. д. Использование возможностей фор- 
мальных методов минимизировалось, так как мы понимали, что эти ме- 
тоды во многом призваны заменить тот способ, каким задачу управле- 
ния решает нервная система, а мы старались вскрыть именно этот спо- 
соб. Мы исходили из того, что голова ребенка, который учится ездить 
на велосипеде, оперирует не дифференциальными уравнениями, и стара- 
лись понять, чем же именно она оперирует. С формальной точки зре- 
ния мы строили такую систему управления, в которой стратегии управ- 
ления, решение о которых надо принимать управляющей системе, не свя- 
заны прямо с алфавитом распознаваемых классов. Принятие решений в си- 
стеме ААУ опирается не на заранее известную математическую модель объ- 
екта управления, а на эмпирически найденные отображения между следу- 
ющими множествами: 1) множество бинарных сигналов, кодирующих вход- 
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ную информацию о состояниях объекта управления; 2) выходные сигналы 
актуаторам (воздействия и стратегии); 3) оценки качества, состояния объекта 
управления. Отметим, что все перечисленные множества являются бинар- 
ными. 

Существуют большие возможности использования известных методов рас- 
познавания образов в системе ААУ. Так, системы распознавания могут исполь- 
зоваться в составе практически всех подсистем системы ААУ: в блоке датчи- 
ков, в подсистеме ФРО (формирования и распознавания образов), в подсистеме 
управления Базой Знаний, в аппарате эмоций, в подсистеме принятия решений 
и в блоке актуаторов. 


7.2. Метод ААУ и искусственные нейронные сети 


Исходная цель искусственных нейронных сетей (ИНС) была близка цели 
метода ААУ в том плане, что в обоих случаях она состояла в попытке понять 
и смоделировать принцип действия нервной системы и мозга. История ИНС 
большая и долгая, она знала свои подъемы и падения. Здесь мы не будем 
ее описывать. Выделим только то, что имеет отношение к нашей теме. Как 
мы понимаем, основное внимание в годы появления ИНС было сосредоточено 
на попытках понять принцип действия нервной клетки и сетей из таких 
клеток, но не принцип действия всей нервной системы и мозга. Существовало 
много моделей нейронов и сетей. Первая модель нейрона, построенная по 
законам математической логики («формальный нейрон»), была предложена 
в 1943 году У. Маккалоком и У. Питтсом [47]. Эта модель была, по-видимому, 
более других адекватна свойствам биологического нейрона и сетей из ней- 
ронов. В дальнейшем схема этого нейрона развивалась Ф. Розенблаттом, 
С. К. Клини, Д. Т. Калбертсоном, фон Нейманом, Ю. Т. Медведевым и дру- 
гими. В результате этих усилий была получена схема формального нейрона, 
представляющего собой взвешенный сумматор, снабженный «активационной 
функцией», которая демонстрировала практически очень полезное свойство — 
она могла быть обучена распознавать некоторые образы. С этого момента 
специалисты по ИНС практически разошлись с биологией и увлеклись назван- 
ным прагматическим свойством ИНС. Формальный нейрон уже существенно 
отличался от исходной бионической модели Маккалока и Питтса, но был очень 
удобной моделью для программирования. Пережив падение интереса к ИНС, 
вызванное проблемой представимости невыпуклых форм в признаковом про- 
странстве, выявленной Минским в 1969 году [48] и, спустя многие годы, благо- 
получный выход из кризиса в связи с найденным решением — многослойными 
сетями, ИНС с тех пор как бы варятся в своем собственном котле, в котором 
решаются в основном проблемы ускорения обучения и повышения надежности 
распознавания. К проблеме привлечены колоссальные интеллектуальные силы 
математиков, созданы специальные науки нейроматематика и нейроинформа- 
тика. Успешные варианты ИНС постепенно начинают прокладывать дорогу 
в практику, успешно решая задачи распознавания, без применения математи- 
ческих моделей распознаваемых объектов, принося прибыли, чем и поддер- 
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живается интерес к ИНС. Голоса нейрофизиологов, уставших за пройденные 
десятилетия повторять, что ИНС мало похожи на нервные системы, слабо 
слышны в среде специалистов, увлеченных способностью ИНС распознавать 
образы. 

Мнения нейрофизиологов об ИНС состоят вкратце в том, что: 


а) формальный нейрон ИНС лишь очень отдаленно похож на биологиче- 
ский нейрон, последний решает какие-то иные задачи, сильно отличаю- 
щиеся от сравнивания взвешенной суммы с заданным порогом, и многие 
свойства биологического нейрона не отражены в формальном нейроне, 

б) нервная система решает отнюдь не только задачу распознавания, но, 
в целом — задачу управления, и не просто управления, а адаптивного 
управления, 

в) структура нервной сети далека от однородности, на которой все дер- 
жится в теории ИНС. 


Однако и в развитии ИНС становится заметным определенный тупик, 
вызванный идейным, теоретическим и практическим исчерпанием потенци- 
ала той модели ИНС, которая была предложена в 60-е годы. Необходимость 
предварительного обучения, трудность и ненадежность обучения, сложности 
с учетом параметра времени, ограниченность применения только задачей 
распознавания и аппроксимации — эти и некоторые другие проблемы стоят 
на пути дальнейшего развития ИНС. В поисках выхода из тупика специалисты 
по ИНС начинают прислушиваться к биологам и возвращаться к биологии как 
источнику идей и решений. 

Появляющиеся бионические идеи дают новые импульсы развитию теории 
и практики ИНС. В их числе модульные ИНС, прореженные ИНС, различ- 
ные подходы к построению самообучаемых ИНС. Ярким примером такого 
успешного бионического решения является модель нейрона, учитывающего 
импульсно-периодический характер межнейронных сигналов, разработанная 
Б. В. Крыжановским [49]; эта модель нейрона на 2-3 порядка повышает ем- 
кость ИНС и помехоустойчивость при распознавании. 

Система ААУ, даже в ее нейроноподобном варианте, разрабатывалась 
не как система распознавания, а сразу как система управления и управле- 
ния адаптивного. Нейросети, из которых состоит система ААУ, нерегулярны 
и неоднородны изначально, потому что в составе УС ААУ имеются различные 
подсистемы, реализуемые разного вида сетями из нейронов. Но даже и сеть 
распознающей подсистемы тоже неоднородна и не регулярна по своей идее. 
Нейроны в системе ААУ являются самообучаемыми и не требуют внешнего 
наблюдателя и учителя для управления весами, как того требуют ИНС. Глав- 
ное общее отличие системы ААУ от ИНС в том, что система ААУ обучается 
непосредственно в процессе управления, а ИНС требуют предварительного 
обучения на обучающей выборке. ИНС не могут дообучаться в процессе 
управления, так как подвержены болезни «катастрофического забывания». 
Суть этого эффекта в том, что если обученную ИНС попытаться дообучить 
распознавать еще один образ без тотального переучивания, то ИНС может 
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забыть все, что знала. Это свойство ИНС практически не совместимо с задачей 
адаптивного управления. 

Нами неоднократно предпринимались попытки реализовать систему ААУ 
на базе ИНС, но до сих пор они заканчивались неудачей, слишком уж велико 
отличие современных ИНС от свойств, которым должна отвечать модель 
нервной системы. 


7.3. Метод ААУ и экспертные системы 


В структуре управляющей системы ААУ выделяется подсистема, которая 
называется нами Базой Знаний (БЗ). К БЗ можно отнести совокупность нейро- 
нов, сформировавших такие образы, в прообразы которых входила информа- 
ция о действиях, совершенных самой управляющей системой, т. е. прообразы, 
которые можно интерпретировать как причинно-следственную последователь- 
ность событий «условие — действие — следствие». Не все множество нейронов 
в управляющей системе работает именно с такой информацией. Если при 
анализе системы ААУ все-таки выделить БЗ как отдельную подсистему, то 
можно говорить, что система ААУ есть система автоматического получения, 
накопления и использования знаний в реальном времени управления. Тем 
самым появляются основания для сравнения системы ААУ с экспертными 
системами (ЭС). 

Целью, стоящей перед разработчиками ЭС, является, по определению, со- 
здание прикладных интеллектуальных систем, предназначенных для оказания 
консультационной помощи специалистам, работающим в некоторых предмет- 
ных областях. Целью методологии ААУ является построение концептуальной 
модели нервной системы и мозга, что относится к разряду фундаментальных 
проблем. 

С точки зрения назначения систем, ЭС предназначена для представления 
в ЭВМ знаний, накопленных человеком-экспертом, для дальнейшего их тира- 
жирования и использования в режиме поддержки принятия решений другими 
специалистами в данной предметной области. 

Сравнение можно проводить также по содержанию используемых в си- 
стеме знаний, степени автоматизации и способам реализации. Если знания, 
накопленные в мозге человека, ранжировать по их сложности, комплексности, 
абстрактности, то ЭС, по их первоначальному определению, предназначены 
для работы с вербализованными посредством человеческого языка знани- 
ями из области высокоинтеллектуальной профессиональной деятельности 
человека-специалиста. В свою очередь, система, ААУ оперирует с множеством 
знаний, начинающихся от элементарной информации, поступающей в двоич- 
ном виде от датчиков-рецепторов, и рассматривает процесс ее последующего 
агрегирования и усложнения. 

Диапазон знаний, обрабатываемых системой ААУ, может расширяться до 
пересечения с диапазоном знаний, обрабатываемых ЭС, при соответствующем 
количественном расширении УС ААУ и использовании указанных возможно- 
стей формирования языка, вербализующего элементы знания. Система ААУ 
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работает на своего рода «рефлекторном уровне», набирая статистику по 
прецедентам пространственно-временной эволюции наблюдаемой информации 
и ее связям с выходными воздействиями, не вдаваясь в содержательный 
смысл найденных закономерностей, а только оценивая их влияние на целевую 
функцию. Видимо, здесь уместна аналогия с ситуацией в нервной системе 
ребенка, когда он, например, осваивает езду на велосипеде, находя зако- 
номерные связи пространственно-временных образов, оценивая их качество, 
и запоминая полученные знания в своей памяти, а затем использует их для 
управления. Применение ЭС в диапазоне знаний, соответствующих процессам 
на уровне рецепторов и нейронов нервных систем, вряд ли целесообразно, так 
как выходит из сферы предназначения ЭС по их определению и неэффективно 
по реализации. 

С точки зрения уровня автоматизации систем, система ААУ по своей идее 
полностью автоматическая автономная система, работающая без участия 
человека и реализующая в реальном времени процесс обучения и управле- 
ния. ЭС по своей идее — средство автоматизации представления знаний, 
накопленных человеком-экспертом, и использования этих знаний человеком 
в режиме консультирования. 

С точки зрения способов реализации, наиболее органичным для си- 
стемы ААУ способом является нейросетевой подход в его аппаратном вопло- 
щеними, наиболее адекватном строению естественных нервных систем. Подходы 
к реализации ЭС по способам «представления знаний» и «рассуждений» 
ориентированы на программные реализации. 

Общие черты в системе ААУ и ЭС можно увидеть в том, что в составе 
обеих систем имеются блоки распознавания образов, представления знаний, 
принятия решений, что характерно для многих автоматических или полуавто- 
матических управляющих и интеллектуальных систем. 

Сближение подходов ЭС и ААУ будет происходить по мере появления 
в ЭС следующих свойств: способности работать в автоматическом режиме и 
в режиме реального времени, ориентации на работу с элементарной сенсорной 
информацией, переходу к автономным способам использования, что, вообще 
говоря, входит в противоречие с исходным назначением ЭС. Системы ААУ мо- 
гут приближаться к свойствам ЭС, если разрушить автоматический принцип 
действия системы ААУ и перевести ее на полуавтоматический режим работы 
в качестве системы поддержки принятия решений. 


7.4. Метод ААУ и системы нечеткой логики 


В последнее время широкое развитие получают управляющие системы на ос- 
нове нечеткой логики (ЁРа2ху 1оріс). Идея управляющих систем на основе 
нечеткой логики (НЛ) состояла в том, чтобы автоматизировать способ при- 
нятия решений, которым пользуется человек-оператор. Собственно, сам этот 
способ удается описать после тщательного объяснения его самим оператором. 
Оказалось, что при принятии решения человек-оператор часто опирается 
на примерно следующие рассуждения: 
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Рис. 7.1. Сопоставление физического значения температуры 
с нечеткими переменными 


«Значение этого параметра сейчас скорее велико, чем мало, поэтому я начну 
уменьшать управляющее воздействие». 

«Препятствие скорее еще далеко, чем близко, поэтому я пока не буду тормо- 
зить». 


«Про температуру воды я могу сказать, что она скорее холодная, чем горячая, 
поэтому я немного открою кран горячей воды». 


Такие и подобные им аргументы позволяют человеку успешно вести управ- 
ление самыми сложными объектами. Формализовать такого рода рассуждения 
удалось с помощью так называемых нечетких функций принадлежности, вы- 
ражающих степень соответствия текущего значения параметра (логической 
переменной) той или иной из рассматриваемых нечетких переменных. 

Например, на рис. 7.1 показано, как по мнению некоторого человека- 
оператора сопоставляется текущее значение температуры #0 воды с нечеткими 
переменными (нечеткими множествами) «холодная», «теплая» и «горячая». 
Здесь степень принадлежности данной температуры + к нечеткой переменной 
«холодная» равна 0.10, к нечеткой переменной «теплая» — 0.65, а к переменной 
«горячая» — 0.00. 

При обработке нечетких правил применяются стандартные операции над 
нечеткими множествами, в результате чего происходит вычисление степеней 
принадлежности физических воздействий к значениям лингвистических пере- 
менных. По рассчитанной степени принадлежности можно принимать решение 
о значении управляющего воздействия. 

Этот метод удобен тем, что в нем используется не так много математиче- 
ских расчетов, но его можно применить для управления различными объек- 
тами. Например, для управлением мобильным роботом. В этом случае надо 
указать, как поворачивать руль при той или иной степени принадлежности 
текущей ситуации к заранее заданным типовым случаям. 

Метод НЛ родился в рамках работ по экспертным системам и представлял 
новый способ формализации знаний человека-эксперта, позволяющий воспро- 
изводить его рассуждения с помощью компьютера. В своем каноническом 
варианте метод НЛ не предусматривал автоматического составления или кор- 
рекции нечетких правил. 
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В рамках работ над методом ААУ нами исследовалась возможность приме- 
нения метода НЛ в составе системы ААУ. Были найдены способы автоматиче- 
ской генерации и последующей коррекции нечетких правил, которые исполь- 
зуются как в подсистеме ФРО, так и в Базе Знаний системы ААУ [87]. Эти 
результаты позволили применять метод НЛ в автоматическом режиме в рам- 
ках системы ААУ, что существенно расширило возможности системы ААУ, и, 
на наш взгляд — возможности метода НЛ. 


7.5. Метод ААУ 
и системы обучения с подкреплением 


Довольно часто приходится слышать, что метод ААУ сводится к методу 
обучения с подкреплением (геіпіогсетепф Іеагпіпе — КІ). В этих методах 
можно найти некоторые общие черты, однако во многих отношениях разница 
в этих методах существенна. Метод ААУ, имея целью моделирование 
принципа, действия нервной системы, предлагает общий метод решения задач 
автономного управления в условиях высокой неопределенности исходных 
знаний о свойствах объекта управления и среды. Метод ААУ закрепляет 
структуру системы, подчеркивая необходимость наличия системообразующего 
фактора — аппарата эмоций. Отдельные же подсистемы могут быть реализо- 
ваны различным способом, с использованием многих других технологий, в том 
числе, возможно, и метода БІ. Ключевым понятием систем ААУ является 
понятие образа и его эмоциональной оценки. Система учится распознавать 
образы, приписывает им эмоциональные оценки на основе оценок Базовых 
образов, выделяет закономерности в окружающей среде и использует их для 
получения образов с лучшими оценками. 

Метод КІ, в своем классическом варианте, решает задачу поиска оптималь- 
ной стратегии в марковском процессе принятия решений, т.е. поиска отоб- 
ражения дискретного конечного пространства состояний в конечное дискрет- 
ное пространство действий. Очевидно, что такая постановка задачи сильно 
ограничивает область применения этого метода. В действительности, приме- 
нить этот метод без модификаций, так сказать «в лоб», получается только 
для поиска стратегии в настольных играх (нарды) или при поиске решения 
некоторых сложных алгоритмических задач. В остальных случаях так на- 
зываемые системы, построенные на основе КІ, включают в себя несколько 
подсистем, только в одной из которых, собственно, и используется КІ. При 
применении метода ВТ, проблемой является то, что большинство практических 
задач управления не являются марковскими процессами. Тем не менее, такие 
системы демонстрируют неплохие результаты на практике. 

Основной способ применения системы КІ. состоит в следующем. Если 
задана среда, которую можно описать множеством различимых для ОУ дис- 
кретных состояний (например, пронумерованное клеточное пространство), 
с фиксированной целевой точкой, к которой ОУ должен найти близкий к опти- 
мальному путь (что и рассматривается как адаптивность ОУ), то ОУ, совершая 
поначалу случайные блуждания, формирует у себя в памяти Базу Знаний, 
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которая дает ОУ следующие инструкции: «Если ты находишься в клетке 
с таким-то номером, то тебе лучше идти налево». Тем самым, База Знаний си- 
стемы КІ. описывает возможные в данной среде переходы из множества состоя- 
ний в множество качественных оценок. Такая База Знаний годится для многих 
практических решений, но она неудобна тем, что при изменении положения 
целевой точки обучение нужно начинать сначала. Ситуация с Базой Знаний си- 
стемы КІ, примерно такая, как если бы мы вместо карты метро имели бы в ру- 
ках таблицу, в которой напротив названия каждой станции в их списке было 
бы написано, в какую сторону нам лучше ехать с этой станции. Такая карта 
годится только для случая, если вы всегда ездите в метро только к одной и той 
же цели. Если вы захотите поехать к другой цели, эта карта вам не поможет. 

Напротив, система ААУ имеет целью получение Базы Знаний, которая 
отображает множество состояний в множество состояний. Соотнесение со- 
стояний с их качественными оценками осуществляется отдельно и может 
изменяться. Такая База Знаний подобна карте метро, где вам показывают, 
каким способом можно переехать с любой станции на любую другую станцию. 
А целевая станция указывается аппаратом эмоций. Цель может меняться, 
но вы используете ту же БЗ для поездок к разным целям. 

Понятно, что появляются модификации КІ, которые ставят целью преодо- 
ление указанных недостатков. В настоящее время мы ищем способы объеди- 
нения технологии ААУ и метода КІ, хотя возможность успеха пока не пред- 
ставляется нам очевидной. 


7.6. О сопредельных территориях исследований 


Описанный в этой книге метод автономного адаптивного управления отражает 
наш взгляд на некоторые проблемы и способы моделирования естественных си- 
стем управления, нервных систем, мозга, интеллекта. Очевидно, что далеко не 
все важные стороны этих явлений попали в наше поле зрения и лежат за преде- 
лами наших моделей и рассуждений. Важную роль играют обзорные работы, 
освещающие различные направления и стороны исследований, подходы к ре- 
шениям, способы и результаты моделирования. Настоящая книга не содержит 
такого обзора сопредельных территорий, она была задумана как изложение 
лишь авторской концепции, которая не противоречит другим теориям и не 
посягает на их достоинства, но, как нам кажется, органично вписывается в их 
структуру. Тем не менее, целесообразно пусть вкратце, но обозначить главные 
детали хотя бы некоторых из этих территорий, вплотную примыкающих к теме 
нашего исследования. 

Возможно, что наиболее близкой к представленной концепции авто- 
номного адаптивного управления является теория функциональных систем 
П. К. Анохина [50]. Хотя схемы этих моделей естественных управляющих 
систем — концепции автономного адаптивного управления и теории функцио- 
нальных систем развивались в разное время и с разных позиций, но они имеют 
достаточно много общих черт. Конечно, с того времени, когда создавалась 
теория функциональных систем, прошло немало времени, появились современ- 
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ные компьютеры и современные математические методы, которые позволяют 
строить практически работающие модели, получено много новой информации, 
которую можно учесть при построении этой модели. Тем не менее, теория 
функциональных систем остается сегодня одной из самых плодотворных и спо- 
собна направлять исследования в этой области. 

Мы неоднократно говорили о необходимости априорной приспособленности 
многих деталей объекта управления и управляющей системы к реалиям кон- 
кретной среды обитания объекта управления данного вида. Откуда берется 
и как настраивается такая приспособленность? Откуда вообще появляется 
способность организмов к управлению? Очень интересные ответы на эти во- 
просы и модели происхождения феномена интеллекта, начиная от простейших 
его форм, можно найти в книге В. Г. Редько «Эволюция. Нейронные сети. 
Интеллект» [51]. 

Возможные механизмы появления нервных систем, законы и эволюционные 
свойства их функционирования, в частности механизмы формирования нерв- 
ных сетей и другие вопросы, имеющие самое близкое отношение к рассмотрен- 
ной теме, можно найти в замечательной книге В. Ф. Турчина «Феномен науки. 
Кибернетический подход к эволюции» [52]. 

Адаптивный характер поведения присущ не только организмам под влия- 
нием их нервных систем, но и простейшим формам живого и всей экосистеме. 
Многие интересные свойства эволюции биосферы как единой экологической 
системы, интересные модели развивающейся жизни представлены в книге 
В. Ф. Левченко «Эволюция биосферы до и после появления человека» [53], 
которому автор признателен за стимулирование интереса к данной теме. 

Вопросам развития феномена приспособительного поведения и управления 
живой природы на системном уровне посвящена книга С. Н. Гринченко «Си- 
стемная память живого» |54]. Этот подход тем более интересен для нас, 
что заставляет с большой тщательностью подойти к моделированию нейрона. 

Когда автор искал способы формального описания разработанной модели 
самообучаемого нейрона, то была использована и методика конечных авто- 
матов. Получившаяся диаграмма Мура, описывающая поведение нейрона как 
конечного автомата [24], оказалась очень похожей на характерные диаграммы 
самообучаемых автоматов, разрабатывавшихся с 1960-х гг. М. Л. Цетлиным, 
Ю. И. Неймарком, А. Н. Рапопортом. Совпадение оказалось далеко не случай- 
ным, так как вызвано моделированием одного и того же объекта — нейрона или 
свойств нервной системы, построенной на нейронах. О возможностях приме- 
нения такого подхода можно прочитать в книге А. Н. Рапопорта «Автоматные 
модели поисковой оптимизации» [22]. 
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7.7. О неизбежности сближения методов ИИ 


В заключение необходимо высказать общепримирительную мысль о неизбеж- 
ности слияния в будущем всех методов и подходов искусственного интеллекта 
в одну теорию. Эта теория будет описывать: 

а) принципы функционирования естественных систем управления на всем 
диапазоне их проявления от простейших форм жизни до экосистем и, 
возможно, выше, до описания сознания как атрибута материи; 

б) способы построения искусственных систем с аналогичными свойствами. 


Необходимость такого слияния всех частных разобщенных теорий вызывается 
тем, что: 


1) специалисты, которые ставят себе целью понять и смоделировать 
устройство живых систем, имеют один объект исследования и когда- 
нибудь должны сойтись в его понимании, даже если они начали его изу- 
чение с различных сторон, и 

2) специалисты, создающие прагматические системы без оглядки на при- 
роду, всегда будут находиться в ее рамках, так как сами они есть 
проявление природы. 


Возможно, что все изобретения человека напоминают ситуацию с изобрете- 
нием колеса, которое в гораздо более рациональной форме ног было уже очень 
давно изобретено природой. 

На заре кибернетики ученые собирались вместе и понимали друг друга, 
говоря о необходимости построить машины и программы, которые способны 
решать такие задачи, которые может решать человек. Но потом, по мере 
открытия разных подходов, пути ученых разошлись. Кто-то создавал системы 
распознавания на математических принципах, кто-то создавал модели нерв- 
ных сетей, одни программировали знания в экспертных системах, другие 
со скальпелем в руках вскрывали тайны нервных тканей. Изобретя свои 
системы понятий и терминов для общения в своих сферах, бывшие соратники, 
попавшие в разные сферы, перестали понимать друг друга, как строители Ва- 
вилонской башни. Но на современном уровне развития многочисленных наук, 
имеющих дело с интеллектуальными системами, центробежный разлет уже 
приостановился, и явно началось центростремительное движение навстречу 
друг другу. Лингвисты стали прислушиваться к нейросетевикам, биологи — 
к математикам и т. д. Встреча этих наук на одной конференции в не очень от- 
даленном будущем и возвестит о создании одной общей концепции интеллекту- 
альных систем. Для примера укажем на некоторые факты, иллюстрирующие 
такое сближение: 

— вэкспертные системы вводятся средства автоматического самообучения; 

— в нейросетях вводится модульность и применяются генетические алго- 

ритмы; 

— распознавание рукописного текста осуществляется нейросетями; 

— нейросети давно породнились с нечеткими системами; 

— при построении антропоморфных роботов используются математиче- 

ские методы распознавания. 
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Теперь, когда все соображения, обоснования, разработки и практические при- 
меры подробно описаны, время спросить, а что же именно предлагает автор и 
чем это отличается от того, что уже было? 

Предлагаемый автором подход к построению систем управления, модели- 
рующих нервные системы, достаточно необычен. Однако мы убеждены в зако- 
номерности предлагаемого в данной книге подхода и призываем специалистов 
вдуматься в логику представленных рассуждений и либо согласиться, либо 
обоснованно опровергнуть ее. Позиции, которые мы декларируем, состоят в 
следующем. 


1. Нервные системы могут являться объектами моделирования (не для 
всех это очевидно), принцип их действия можно понять и частично можно 
воспроизвести в действующих моделях, например программных, программно- 
аппаратных и аппаратных. Результат будет хотя и успешным, но частичным. 
Частичным по следующим двум причинам. 

Во-первых, мы еще не знаем всего о Природе, не знаем таких вещей, 
которые могут оказывать самое решительное влияние на функционирование 
нервных систем. Например, мы не знаем всех каналов поступления априор- 
ной информации в нервную систему. Мы знаем о передаче наследственной 
информации генетическим путем, мы знаем о способе передачи априорной 
информации через «штатные каналы» органов чувств в процессе самообучения 
нервной системы, а также в процессе обучения детей родителями и младших — 
старшими. Но все ли это каналы? Не существует ли каких-нибудь других 
способов передачи информации через поля, химический обмен или что-то 
другое? В этом случае такая информация может восприниматься нервной 
системой как подсознание, интуиция, наитие, ощущение и т. п., но играть 
важную роль при управлении. Далее, мы не знаем всех «баз знаний», в 
которых такая априорная информация может храниться. Мы знаем, что она 
хранится в генах, в памяти взрослых особей, которые учат молодых, в самой 
реализованной в текущий момент действительности — в фенотипе живых 
организмов, в формах и свойствах природы, которая тоже учит тех, кто 
способен наблюдать ее, люди научились передавать информацию о прошлом 
в будущее в книгах и т. п. Но исчерпываются ли этим существующие способы 
передачи априорной информации? Нет ли каких-нибудь иных «баз знаний», 
активно влияющих на поведение живых организмов? Мы не знаем этого, и, 
не зная, не можем утверждать, что такие каналы и такая информация не 
влияют на управление больше, чем информация, добытая нервной системой 
самостоятельно в процессе жизни посредством тех алгоритмов, которые мы 
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описали в книге. Говоря терминами нашей книги — не играют ли кажущиеся 
нам случайными «истоки» более важную роль в управлении, чем сами нервные 
системы? Возможно, что-то, что кажется нервной системе случайным, на са- 
мом деле не случайно. Возможно, это что-то обеспечивает живым организмам 
направленный поиск, и в результате эволюция идет быстрее, чем шла бы при 
полностью случайном поиске. 

Во-вторых, мы не можем никак заменить многомиллионнолетнюю эволю- 
цию, которая должна была оптимизировать живые организмы и их системы 
управления так, что разобраться в результате этой оптимизации будет чрез- 
вычайно сложно. Этот фактор усугубляется еще и тем, что, как мы предпо- 
ложили выше, нервная система — это только рабочий инструмент познания, 
имеющий ограниченную мощность и память. Поэтому результаты, добытые 
этим инструментом, — знания, закрепляющиеся в нервной сети, должны со 
временем уходить из этой сети, освобождать ее для дальнейшей поисковой 
работы. Добытые знания должны переходить в «аппаратную реализацию» 
организма — в форму его лап, крыльев и другие овеществленные детали и 
конструкции. 

Поэтому мы говорим: да, если мы и можем сконструировать искусственную 
нервную систему, то она будет подобна нервной системе простого организма, 
только начинающего свой долгий эволюционный путь. И все попытки ее 
искусственной оптимизации не заменят долгого процесса оптимизации эволю- 
ционной. 


2. В книге представлена логически обоснованная схема системы авто- 
номного адаптивного управления, которая следует из того постулата, что 
нервная система сама должна добывать информацию. Если постулат не верен, 
и нервная система может получать необходимую априорную информацию 
извне, из некой «базы знаний на небесах», то вся представленная схема, может 
обрушиться. Если же постулат верен, то цель нервной системы — «познавай и 
выживай». Для «познавай» приходится использовать алгоритм, описанный в 
гносеологии. Для «выживай» нужен аппарат эмоций и принятие решений с це- 
лью максимизации эмоциональных оценок. Отсюда следует почти однозначная 
«принципиальная схема» нервной системы. Подчеркну, что мы не привязы- 
вали функциональные блоки этой схемы к тем или иным разделам мозга. Это 
мы призываем сделать биологов. Мы просто говорили: «Адаптивная система 
управления вынужденно должна решать такие-то задачи. При этом сначала, в 
нервной системе решается задача формирования и распознавания образов, а 
потом уже принятие решений с обращением к Базе Знаний и т. д.». А где эти 
подсистемы расположены, какие органы играют роль этих подсистем — мы не 
стали уточнять, так как для нас это интересная, но второстепенная задача. 

Кстати, из этой схемы следует, что нервная система является системой 
управления с памятью. Это означает, что реакция нервной системы на входное 
раздражение зависит от этого раздражения только частично и во многом 
определяется содержимым памяти, которая наполнялась в предыстории, т. е. 
реакция зависит от обучения. Тем самым, описательный метод изучения 
нервной системы, когда последовательно рассматривается процесс распро- 
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странения нервного возбуждения, может не приносить ожидаемых результа- 
тов, объясняющих функционирование нервной системы, если не учитывать 
наличия памяти и не уметь читать ее содержимого. Так, нельзя понять 
устройство компьютера, изучая его реакцию на нажатие тех или иных клавиш 
на клавиатуре, не учитывая, какая программа и какие данные загружены 
в память компьютера. Но сегодня, насколько нам известно, понятие памяти 
в нервной системе, устройство и функционирование биологической памяти 
только начинают изучаться. Тем более это касается изучения роли памяти 
в процессе управления в биологических системах. Само понятие управления 
еще не является непосредственным и пристальным предметом изучения в 
биологии. 


3. В книге показано, что реализовать работу всех необходимых подсистем 
в нервной системе можно с помощью собранных в определенные сети эле- 
ментарных самообучаемых систем распознавания, каковыми, по убеждению 
автора, являются биологические нейроны. Это утверждение является важным 
и рискованным. Рискованным — потому, что до сих пор, если автор не оши- 
бается, никто не говорил о том, что нейрон — это самообучаемая система 
распознавания. Биологи пока не изучают эффекты изменения распознающих 
свойств нейрона в процессе его обучения. Мы полагаем, что современные 
методики наблюдения за работой нейронов, например те, которые относят к 
биофотонике, уже могут позволить проследить за тем, как нейрон обучается, 
и как при этом изменяются его свойства. Такие исследования уже необходимо 
начинать. Но и специалисты по «искусственным нейронным сетям» тоже 
пока не говорят о том, что отдельный нейрон есть самообучаемая система 
распознавания, и продолжают работать с моделями, которые представляют 
собой варианты пороговых сумматоров. В книге предлагается модель са- 
мообучаемого распознающего нейрона и показывается, как с его помощью 
можно решать все задачи, необходимые для построения нервной системы. 
Предлагаем и биологам, и специалистам по искусственным нейронным сетям 
обратить внимание на эту модель нейрона. Сама по себе эта модель очень 
пластична и может как упрощаться, так и усложняться, что соответствует 
применению более простых или более сложных правил формирования образов 
для самообучающейся системы распознавания. 

Эта часть книги важна еще и по следующей причине. Мы показали, что 
управление может быть организовано не только на основе классической ма- 
тематической теории управления, предписывающей составлять системы диф- 
ференциальных уравнений, описывающих поведение объекта управления. Мы 
показали, что управление может быть построено на основе дискретных инфор- 
мационных самообучаемых систем, которые эмпирически находят реальные 
отображения между множествами входных и выходных бинарных сигналов с 
качественной оценкой состояний. Эти бинарные сигналы, отображающие ре- 
альные объекты и закономерности самой разной сложности, можно называть 
образами. Мы предполагаем, что этот принцип управления и реализуется во 
всех нервных системах. Более того, с этой точки зрения, управление на основе 
математики представляется частным случаем такого биологического способа 
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управления. Потому что математика — это лишь сложившаяся в головах 
(в нервных сетях) специалистов-математиков система специальных образов, 
отражающих закономерности Природы. Система математических образов поз- 
воляет моделировать поведение некоторых объектов и, соответственно, ма- 
нипулировать ими. Например, строить САУ, ПИД-регуляторы, аналоговые 
вычислительные машины и алгоритмы для цифровых вычислительных ма- 
шин. Но эта, специальная система образов и этот инструмент — математика, 
безусловно, имеют свою органичную сферу применения и свои ограничения. 
Во всяком случае, мы видим, что биологические системы управления решают 
более широкий круг задач, чем это позволяет делать математика. 

Конечно, и биологические системы управления тоже имеют свои огра- 
ничения. Прежде всего, эти системы были предназначены для управления 
движениями и поведением организмов в нашей среде с ее специфическими 
свойствами, характерными размерами и специфической динамикой. Не надо 
ожидать от нервной системы с ее нейронами и нервными импульсами, что она 
может представить себе процессы, происходящие в микромире атомов или в 
макромире космоса. Это не те масштабы, объекты и процессы, на которых 
обучалась нервная система, для которых она предназначалась. Ей ближе 
предметы величиной с орех, дерево или поле; с определенным диапазоном 
скоростей изменения и т. д. Это означает, что, проникая в тайны микро- и мак- 
ромира, мы будем вынуждены пользоваться либо абстрактными формальными 
описаниями, либо редуцировать эти объекты к масштабам привычных образов. 
Например, как знаменитый астрофизик И. С. Шкловский, представлять себе 
звезду шаром величиной с арбуз. 


4. В книге показаны реально работающие программные модели объектов, 
управляемых в соответствии с описанными принципами. В настоящее время 
в лаборатории автора работают уже не только программные, но и реальные 
физические модели. Странно смотреть, например, на подвешенную на нити 
модель спутника, которая, покрутившись немного в разные стороны, начинает 
все точнее наводиться на заданную цель и поддерживать свое положение. 
Никаких дифференциальных уравнений не закладывалось в «нервную управ- 
ляющую систему» этого спутника. Можно говорить без кавычек, что он сам по- 
нял, что от него требуется, и научился поддерживать нужное положение. Это 
произошло потому, что он испытывал неприятные эмоции при отклонении от 
цели и приятные — при необходимом положении. Он сам научился управлять 
своим телом. Еще интереснее наблюдать за процессом самообучения мобиль- 
ного робота. Тем самым, мы видим некие искусственные «протоорганизмы». 
Кавычки можно оставить или убрать, суть от этого не изменится. 


5. И последнее положение книги — это призыв автора начать работу над 
созданием искусственных машин-организмов, самообучающихся и эволюцио- 
нирующих подобно живым организмам. Речь идет, конечно же, об адаптивных 
системах управления с элементарными, но очень полезными свойствами. Как 
отмечается многими, сегодня, когда самых разных машин в нашем окружении 
становится все больше, возникает дефицит внимания человека к машинам — 
один человек не может обслужить все машины, обслуживающие его, напри- 
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мер, в квартире. Если бы все наши пылесосы, холодильники, стиральные 
машины и т. д. и т. п. имели многочисленные ручки настройки и управления, 
человек бы не успевал бегать от одной машины к другой, включая, выключая 
и регулируя их. Современная машина должна управляться самостоятельно. 
В том числе — сама включаться и выключаться в нужные моменты. В 
идеале — совсем без участия человека. А поскольку ПИД-регуляторов к 
каждой машине не придумать, то придется наделять машины искусственными 
самообучаемыми системами управления, которые автор называет системами 
автономного искусственного интеллекта (АИИ). 

«Да здравствуют адаптивные зой и Ват!» — вот предлагаемый нами лозунг 
для перспективы развития современной техники. 
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По мнению, сформулированному в 1960-е гг. академиком П.К. 
Анохиным, главным недостатком исследований в области естест- 
венного и искусственного интеллекта являлось отсутствие универ- 
сальной модели, логически связывающей все этапы формирования 
интеллектуальных актов. 

Возможно, что в настоящее время такой моделью мог бы служить 
метод автономного адаптивного управления. Его разработка была 
начата более 20 лет назад в Ленинградском физико-техническом 
институте им. А.Ф. Иоффе АН СССР, продолжалась в Вычисли- 
тельном центре РАН и в Институте системного программирования 
РАН. За это время по данной проблеме было опубликовано около 70 
научных трудов. 

Данная книга предлагает возможные ответы на следующие вопросы: 
как должна быть устроена нервная система с логически-рациональной 
точки зрения; какова роль нейрона в адаптивном управлении; можно ли 
воспроизвести путь «конструкторской мысли», который прошла 
Природа, конструируя нервные системы; как создать искусственные 
системы с подобными свойствами? 

Рассмотрены способы построения адаптивных систем управления и 
систем динамической оптимизации на основе эмпирических знаний. 
Представлены прототипы некоторых прикладных систем, построенных 
с использованием предложенного метода. 

Книга будет интересна и полезна научным работникам, аспирантам 
и студентам, интересующимся кибернетикой, а также специалистам по 
системам управления, биологам и математикам. 


